Medidas de dispersión
Estadística Descriptiva
Medidas de dispersión
Las medidas de dispersión cuantifican la variabilidad (el grado de separación) que
presenta un conjunto de datos. Mientras mayor sea el valor de la medida usada,
mayor será la distancia de los datos respecto al centro. Entre las medidas de
dispersión usadas comúnmente, se encuentran:
- Rango.
- Varianza.
- Desviación estándar o típica.
- Coeficiente de variación.
Medidas de dispersión
Rango o amplitud
La dispersión puede medirse en términos de la diferencia entre los dos valores
extremos del conjunto de datos. De esta forma, el rango se define como la
diferencia entre el máximo y el mínimo valor de la distribución.
Rango =
Observación: Esta medida de dispersión tiene como inconveniente ser poco
representativa, cuando existen valores extremos atípicos .
Medidas de dispersión
Varianza
La varianza se define como el promedio de las desviaciones (distancias) cuadráticas
de las observaciones respecto del promedio. Mide el grado de dispersión de los
valores de la variable respecto a la media aritmética.
Observación: Esta medida de dispersión tiene como inconveniente que las
unidades de la variable están al cuadrado.
Las siguientes fórmulas se utilizan para calcular la varianza, pero nosotros
utilizaremos la planilla de cálculo Excel para obtener este valor.
Varianza poblacional:
Varianza muestral:
Medidas de dispersión
Desviación estándar
La desviación estándar se define como la raíz cuadrada de la varianza. Como la
varianza tiene como unidad de medida el cuadrado de la unidad de la variable, se
hace difícil de interpretar. Al tomar la raíz cuadrada, se facilita la interpretación.
Las siguientes fórmulas se utilizan para calcular la desviación estándar, pero
nosotros utilizaremos la planilla de cálculo Excel para obtener este valor.
Desviación estándar poblacional:
Desviación estándar muestral:
Observación: Las medidas de dispersión vistas hasta ahora no
deben ser usadas para comparar entre dos variables con
unidades distintas (por ejemplo, peso y estatura de los
estudiantes de Duoc) o cuando queremos remover el efecto de
la media (por ejemplo, el peso de los elefantes varía más en
términos absolutos que el peso de los grillos, ¿pero en términos
relativos?).
Medidas de dispersión
El coeficiente de variación se define como la razón entre la desviación estándar y
la media aritmética. Normalmente se expresa como porcentaje, al multiplicarlo
por 100.
Observación: Esta medida de dispersión tiene como ventaja que no depende de
las unidades de medidas de la variable, lo cual permite comparar la
variabilidad de datos de variables con distintas unidades.
La planilla de cálculo Excel no tiene una fórmula directa para calcular el
coeficiente de variación, por lo que se debe aplicar la siguiente fórmula.
→ Desviación estándar
Coeficiente de variación:
→ Media aritmética
Medidas de dispersión
Coeficiente de Variación
0% 100%
Datos menos dispersos Datos más dispersos
(más homogéneos) (más heterogéneos)
Homogéneo: Uniforme, semejante, similar, idéntico.
Heterogéneo: Diverso, variado, mezclado, distinto.
Observación: En la mayoría de las distribuciones de datos el coeficiente de
variación toma valores desde 0% al 100%.
Ejemplo 1: Medidas de dispersión con Excel
Los siguientes datos representan las edades en años de dos grupos diferentes de
personas, en las cuales se calculó el promedio. Determine el grupo de personas que
presenta un comportamiento más homogéneo en sus edades.
Grupo 1 Grupo 2
19 – 20 – 20 – 19 – 22 28 – 32 – 30 – 4 – 6
Media: 20 Media: 20
Ejemplo 1: Medidas de dispersión con Excel
Respuesta
Edades grupo 1 Edades grupo 2
35 35
30 30
25 25
20 20
Edad
Edad
15 15
10 10
5 5
0 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
Persona Persona
Como se puede observar en la gráfica de cada grupo de personas, las medidas
de tendencia central (en este caso la media) no reflejan la variabilidad o
dispersión del grupo de datos.
Es por esto que debemos utilizar otro indicador para medir la variabilidad de los
datos. Este indicador puede ser el coeficiente de variación.
Ejemplo 1: Medidas de dispersión con Excel
Respuesta
Con la función “Análisis de datos” y usando “Estadística descriptiva”, podemos
realizar un resumen de estadísticas, para calcular el coeficiente de variación y
determinar cual de las muestras presenta un comportamiento más homogéneo
en sus edades.
Edades del Primer Grupo Edades del Segundo Grupo
Media 20 Media 20
Error típico 0,547722558 Error típico 6,164414003
Mediana 20 Mediana 28
Moda 19 Moda #N/A
Desviación estándar 1,224744871 Desviación estándar 13,78404875
Varianza de la muestra 1,5 Varianza de la muestra 190
Curtosis 2 Curtosis -3,194459834
Coeficiente de asimetría 1,360827635 Coeficiente de asimetría -0,572744408
Rango 3 Rango 28
Mínimo 19 Mínimo 4
Máximo 22 Máximo 32
Suma 100 Suma 100
Cuenta 5 Cuenta 5
Coeficiente de Variación = 1,224744871/20 Coeficiente de Variación = 13,78404875/20
= 0,061 = 0,689
= 6,1% = 68,9%
Ejemplo 1: Medidas de dispersión con Excel
Respuesta
El coeficiente de variación de la edad del primer y segundo grupo, son
respectivamente 6,1% y 68,9%, por lo que el primer grupo presenta un
comportamiento más homogéneo con respecto a la edad, ya que su coeficiente
de variación es menor.
Resumen
Indicadores Estadísticos (Estadígrafos)
Posición Dispersión
Tendencia Central Tendencia No Central •Rango
•Varianza
•Desviación estándar
•Media aritmética •Percentiles •Coeficiente de variación
•Moda
•Mediana