DEDICATORIA:
Este trabajo lo dedico con mucho amor y cariño
a mis padres y maestros por haberme brindado
sus conocimientos hasta el final del segundo
ciclo de mi carrera superior.
I. INTRODUCCIÓN
Hasta el momento hemos estudiado los valores centrales de la
distribución, pero también es importante conocer si los valores en general están
cerca o alejados de estos valores centrales, es por lo que surge la necesidad de
estudiar medidas de dispersión
Las medidas de dispersión complementan a estas medidas de tendencia
central. Además, son esenciales en una distribución de datos. Esto es porque
caracterizan la variabilidad de los datos. Su relevancia en la formación
estadística ha sido señalada por Wild y Pfannkuch (1999).
En estas medidas, la percepción de la variabilidad de los datos es uno
de los componentes básicos en el pensamiento estadístico. La percepción de la
variabilidad de los datos nos da información sobre la dispersión de los datos con
respecto a un promedio o media.
II. REVISIÓN DE LITERATURA
2.1. Medidas de Dispersión
2.1.1. Concepto
Las medidas de tendencia central ofrecen una idea aproximada del
comportamiento de una serie estadística. No obstante, no resultan suficientes
para expresar sus características: una misma media puede provenir de valores
cercanos a la misma o resultar de la confluencia de datos estadísticos
enormemente dispares. Para conocer en qué grado las medidas de tendencia
central son representativas de la serie, se han de complementar con medidas de
dispersión como la varianza o la desviación típica.
Las medidas de centralización ayudan a determinar el «centro de
gravedad» de una distribución estadística. Para describir el comportamiento
general de la serie se necesita, sin embargo, una información complementaria
para saber si los datos están dispersos o agrupados.
Así, las medidas de dispersión pueden definirse como los valores
numéricos cuyo objeto es analizar el grado de separación de los valores de una
serie estadística con respecto a las medidas de tendencia central consideradas.
Las medidas de dispersión son de dos tipos:
Medidas de dispersión absoluta: como recorrido, desviación media,
varianza y desviación típica, que se usan en los análisis estadísticos
generales.
Medidas de dispersión relativa: que determinan la dispersión de la
distribución estadística independientemente de las unidades en que se
exprese la variable. Se trata de parámetros más técnicos y utilizados en
estudios específicos, y entre ellas se encuentran los coeficientes de
apertura, el recorrido relativo, el coeficiente de variación (índice de
dispersión de Pearson) y el índice de dispersión mediana.
2.1.2. Rango o Recorrido
Es la primera medida que vamos a estudiar, se define como la diferencia
existente entre el valor mayor y el menor de la distribución, Lo notaremos como
R. Realmente no es una medida muy significativa en la mayoría de los casos,
pero indudablemente es muy fácil de calcular.
Hemos estudiado varias medidas de centralización, por lo que podemos
hablar de desviación con respecto a cualquiera de ellas, sin embargo, la más
utilizada es con respecto a la media.
Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
La principal ventaja del rango es su fácil cálculo aunque su valor es poco
significativo, ya que sólo tiene en cuenta los dos valores extremos.
Ejemplo: Considérese los siguientes conjuntos de datos:
2 2 2 2 2 3 4 4 4 4 4 4 4 4 4 5 6 10
R = 10 - 2 = 8
2.1.3. Desviación Media
La desviación media es la media de la distancia de los valores de los
datos (en valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias
negativas con distancias positivas, lo que daría como resultado que la desviación
media sea cero para cualquier distribución de datos.
Ejemplo de cómo calcular la desviación media
Vamos a ver un ejemplo de cómo calcular la desviación media. Vamos
a calcular la desviación media de las notas del Amigo C:
Vamos a utilizar tablas, ya que así el procedimiento para calcular la
desviación media te sirve para cuando tengas muchos datos y para cuando
tengas pocos.
En primer lugar, ordenamos los datos en una tabla con la frecuencia
absoluta de cada uno de ellos, dejando la última fila para la suma total de
elementos de datos:
Vamos a empezar calculando la media, ya que la necesitamos para
obtener las desviaciones. Añadimos una tercera columna para escribir el
resultado de multiplicar cada dato por su frecuencia absoluta. En la última fila
sumamos los resultados:
Ya tenemos los datos que necesitamos para calcular la media, según la
fórmula, que son la suma de las multiplicaciones de cada dato por su frecuencia
absoluta y el número total de datos:
La suma de las multiplicaciones de los datos por la frecuencia absoluta
es 25 y lo tenemos en la última fila de la tercera columna. El número total de
datos es 5 y lo tenemos al final de la segunda columna:
La media es 5.
Una vez tenemos la media, ya podemos calcular la distancia o la
desviación de cada dato, como el valor absoluta de la diferencia entre cada dato
con la media:
Para ello, añadimos una cuarta columna donde iremos escribiendo la
distancia de cada dato:
Por ejemplo, para el dato 1, la distancia sería:
Lo hacemos igual para el resto de datos y los vamos escribiendo en la
columna. En la última fila, realizamos la suma de todas las distancias:
Ya tenemos los datos que necesitamos para calcular la desviación
media, según la fórmula, que son la suma de las distancias de cada dato y el
número total de datos:
La suma de las distancias es 12 y lo tenemos en la última fila de la cuarta
columna. El número total de datos es 5, que lo tenemos al final de la segunda
columna:
Por tanto, la desviación media para el Amigo C es 2,4.
Las desviaciones medias para el resto de amigos son:
Desviación media Amigo A= 1,2
Desviación media Amigo B= 2,8
Desviación media Amigo D= 1,2
La mayor desviación media es del Amigo B, lo que significa que sus
notas están muy dispersas. Para el Amigo A y el Amigo D, la desviación media
es menor, lo que significa que sus notas están más cerca de su nota media, que
es 5.
2.1.4. Desviación estándar
La desviación típica o estándar es una medida que ofrece información
sobre la dispersión media de una variable. La desviación típica es siempre mayor
o igual que cero. Para entender este concepto necesitamos analizar 2 conceptos
fundamentales.
Esperanza matemática, valor esperado o media: Es la media de
nuestra serie de datos.
Desviación: La desviación es la separación que existe entre un valor
cualquiera de la serie y la media.
Ahora, entendiendo estos dos conceptos la desviación típica se calculará
de forma similar a la media. Pero tomando como valores las desviaciones. Y
aunque este razonamiento es intuitivo y lógico tiene un fallo que vamos a
comprobar con el siguiente gráfico.
En la imagen anterior tenemos 6 observaciones, es decir, N = 6. La
media de las observaciones está representa por la línea negra situada en el
centro del gráfico y es 3. Entenderemos por desviación, la diferencia que existe
entre cualquiera de las observaciones y la línea negra. Así pues, tenemos 6
desviaciones.
De un conjunto de n datos de una muestra es:
Vamos a ver un ejemplo de cómo calcular la desviación típica. Vamos a
calcular la desviación típica de las notas del Amigo C:
A la tabla que ya teníamos antes:
Le vamos a añadir una quita columna con los cuadrados de las distancias:
Por ejemplo, para el dato 1 sería:
Lo hacemos igual para el resto de datos y los vamos escribiendo en esa
columna. En la última fila, realizamos la suma de todos los resultados:
Ya tenemos los datos que necesitamos para calcular la desviación típica,
según la fórmula, que son la suma de las distancias al cuadrado de cada dato y
el número total de datos:
La suma de las distancias al cuadrado es 50 y lo tenemos en la última
fila de la quinta columna. El número total de datos es 5, que lo tenemos al final
de la segunda columna:
Por tanto, la desviación típica para el Amigo C es 3,16
Las desviaciones típicas para el resto de amigos son:
Desviación típica Amigo A= 2
Desviación típica Amigo B= 3,03
Desviación típica Amigo D= 1,26
El Amigo A y el Amigo D tenían la misma desviación media, pero ahora,
cada uno tiene una desviación típica distinta, ya que esta determina de forma
única la dispersión, por lo que con más seguridad podemos decir que el Amigo
D tiene los datos menos dispersos de todos.
2.1.5. Varianza
La varianza es una medida de dispersión que representa la variabilidad
de una serie de datos respecto a su media. Formalmente se calcula como la
suma de las residuos al cuadrado divididos entre el total de observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho
sea de paso, entendemos como residuo a la diferencia entre el valor de una
variable en un momento y el valor medio de toda la variable.
De un conjunto de n datos de una muestra es:
Dónde: n = número de datos
x = valor de cada uno de los datos
s2 = Varianza
Ejemplo:
Para los siguientes datos, calcular la variación.
22 23 24 24 24 26 27 29 34 35
Con base en la fórmula de varianza debemos de identificar los
parámetros que tenemos que calcular.
Primero, calculamos la media:
Segundo, encontramos los demás parámetros de la fórmula:
Tercero, sustituimos los valores en la fórmula:
s2 = 185.6 / 10-1 = 20.62
s2 = 20.62
2.1.6. Coeficiente de Variación
Dado que la desviación típica es una medida que está expresada en las
mismas unidades que la variable, si queremos comparar dispersiones a escalas
distintas necesitamos un parámetro adimensional. En estas situaciones
usaremos el coeficiente de variación que se expresa tanto de forma decimal
como en tanto por ciento, y nos expresaría la desviación típica como porcentaje
con respecto a la media.
El coeficiente de variación es una medida estadística que se calcula
dividiendo la desviación típica entre el valor absoluto de la media y multiplicando
por 100 (para obtener el resultado en tanto por ciento):
Por ejemplo, el coeficiente de variación del ejemplo anterior sería:
El coeficiente de variación se utiliza para comparar datos de una misma
población, que se miden en magnitudes diferentes.
III. CONCLUSIONES
Las medidas de dispersión ya sea con datos agrupados o no agrupados,
permiten identificar qué tan próximos o distantes están los datos con
respecto a un valor de referencia, el cual en términos estadísticos es la
media aritmética; un análisis de los datos que se apoya en los valores de
la mediana, la desviación estándar, la varianza, el coeficiente de variación,
y el rango permite proponer hipótesis acerca del comportamiento de un
grupo de valores de forma mucho más acertada en comparación a mirar
solo un dato.
Con la realización de esta monografía se puede decir que capacidades
suficientes para saber utilizar esta herramienta estadística como ayuda en
nuestra tecnología, desarrollando así actividades que midan nuestro
conocimiento sobre las medidas de dispersión, rango, desviación típica,
coeficiente de variación y la varianza tomando como guía los ejemplos
que ayudaran a una mejor comprensión.
IV. REFERENCIA BIBLIOGRAFICA
Ferris J. Ritchey, 2002. Estadística para las Ciencias Sociales, El potencial de la
imaginación estadística, Editorial Mc Graw Hill.
Martínez Ciro, 2006. Estadística Básica Aplicada, ECOE Ediciones.
Linkografía
https://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n
https://prezi.com/t3jei6soufpe/medidas-de-dispersion/
http://www.vitutor.com/estadistica/descriptiva/a_16.html
http://cvonline.uaeh.edu.mx/Cursos/BV/L0706/U4/lec_43_
TeoriaMedidasDdispersion.pdf
Figura 1. Medidas de Dispersión
Figura 2. Calculo de Medidas de Dispersión