Resumen y organización de datos

Medidas de tendencia central

En ocasiones, en la vida cotidiana nos encontramos con que los datos proporcionan una gran cantidad de información. Cuando,por ejemplo, se dice que el costo promedio de una habitación en diferentes hoteles es de 500 pesos, se están resumiendo todos los precios obtenidos.

Las medidas de tendencia central pueden calcularse tanto para un población como para unamuestra de ésta. Las medidas numéricas que se calculan sobre los datos de la población se conocen como parámetros, y estadísticos cuando se refieren a la muestra.

Media aritmética

En un conjunto finito de números, es igual a la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de losprincipales estadísticos muestrales.

Ejemplo:
Las siguientes cifras se refieren a la cantidad de lluvia en milímetros registrada en diferentes años: 125.3 98 119.2 87.4 92.7 108 162.6 149.8

Se realiza la siguiente operación para obtener la media:
Mediana
La mediana de la muestra (mediana muestral) es el valor de la observación ubicada a la mitad en un conjunto ordenado de datos.

Ejemplo:Se tiene la siguiente serie numérica: 42 42 44 45 43 39 38 36 42 40 36

Se ordenan los datos de menor a mayor.

36 36 38 39 40 42 42 42 43 44 45

Se localiza la cifra que está exactamente a la mitad de la serie: si el numero de cifras es impar se usa la expresión (n+1)/2 y para pares se obtiene la media de los valores de n/2 y n/2+1. En este caso la cantidad de cifras esimpar y n=11, por lo que, el calculo corresponde a (11+1)/2 = 6. La cifra que está en la posición 6 llendo de menor a mayor será el valor que tenga la mediana.

Moda

En un conjunto de datos, es el valor que más se repite.

Ejemplo:

Se tiene la siguiente serie numerica:

1 3 3 3 3 3 4 5 5 6 7 7 7 8 9

En esta serie la moda es 3, ya que es el dato que más se repite. Estotambien se puede concluir con la elaboración de una tabla de frecuencias.

Cuartiles

Los cuartiles son los tres valores de la variable que dividen una serie numérica en cuatro partes iguales: C1, C2, C3.

Solución de un problema.

Se tiene la siguiente serie numérica: 15, 48, 96, 124, 56, 59, 78.

* Se ordenan los datos de menor a mayor:

15 4856 59 78 96 124

* Se obtiene la mediana de la serie numérica: en este caso la mediana es 59
* Para determinar el primer cuartil, se toma la mitad de los datos inferiores al valor de la mediana y se encuentra la mediana de éstos: en este ejemplo el valor de la mediana de los datos inferiores es C1= 48.
* De manera análoga, el tercer cuartil ( siendo el segundo cuartil el valorde la mediana de la serie numérica) es la mitad de los datos superiores, resultanto C3= 96.

Los cuartiles quedan de la siguiente manera:

15 48 56 59 78 96 124
C1 C2 C3

Segunda Parte UNIDAD II
Miércoles, 06 de Mayo de 2009 07:11 p.m.
Ahora pasaremos a la elaboración del Histograma, en el que graficaremos el tiempo contrala frecuencia y la frecuencia relativa.

Interpretación

Se pueden concluir distintas cosas, dependiendo de lo que queramos obtener de las gráficas. Ejemplo de ello es que podemos decir que la mayoría de las personas entrevistadas terminan el juego en un rango de tiempo que va entre 8.21 y 9.31 minutos. El número de personas que más tarda en terminar el juego es considerablemente pequeño.Aunque podemos obtener más conclusiones, todo depende del análisis que se le de.

Polígono de frecuencia

El polígono de frecuencia es otra herramienta útil para describir la distribución de los datos, y su construcción depende del histograma. El polígono de frecuencia se construye uniendo mediante líneas rectas las alturas de las barras del histograma. Lo podemos observar en el siguiente…