Medidas
de
Dispersión
Orden de la sesión
✓ Bienvenidas(os)
✓ Invitación a revisar las sesiones grabadas.
✓ Repaso de la sesión 3
✓ Introducción
✓ Medidas de dispersión
✓ Ejercicios
✓ Conclusiones
✓ Lista de asistencia (anotarse una vez)
✓ Fin de la sesión
“La matemática es la ciencia del orden y
la medida, de bellas cadenas de
razonamientos, todos sencillos y fáciles”
-René Descartes
UTEL más cerca de ti
Repaso de la semana 3
Trabajemos
colaborativamente
Introducción
¿Qué son las medidas de dispersión?
Una descripción más completa del conjunto de datos
puede obtenerse si se mide que tan dispersos están
los datos alrededor del punto central.
Esto es precisamente lo que hacen las medidas
de dispersión. Indican cuanto se desvían las
observaciones alrededor de su media.
Las Medidas de Dispersión son parámetros estadísticos que se calculan para
conocer que tanto varían los datos obtenidos respecto a las MTC, en especial,
respecto a la media (media aritmética o promedio)
Por lo tanto, las medidas de dispersión que vamos a conocer son:
* Rango
* Varianza
* Desviación estándar
* Coeficiente de variación
* Índice de Kurtosis
Rango
La medida de dispersión más simple es el rango, este es simplemente la diferencia
entre la observación más alta y la más baja. El rango nos muestra la distribución de
los valores de una serie. Si el rango es un número muy alto entonces los valores de
la serie están bastante distribuidos; en cambio si se trata de un número pequeño,
quiere decir que los valores de la serie están muy cerca entre sí
Rango = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
Varianza 𝜎 2 / 𝑠 2 (sigma al cuadrado)
La varianza y la desviación estándar son medidas de dispersión mucho más
útiles; proporcionan una medida más significativa sobre el punto hasta el cual
se dispersan las observaciones alrededor de su media.
La varianza es el “promedio de las desviaciones respecto a su media elevadas al
cuadrado”, ¿qué significa esto? que se encuentra la cantidad por la cual cada
observación se desvía de la media, se elevan al cuadrado tales desviaciones y
se halla la media de tales desviaciones elevadas al cuadrado; así, se tiene el
promedio de las desviaciones de la media elevadas al cuadrado.
Varianza de datos aleatorios
Σ (𝑋 − 𝜇)2
𝜎2 =
𝑁
Varianza de datos agrupados
Σ 𝑓(𝑋 − 𝜇)2
𝜎2 =
𝑁
Varianza 𝜎 2 / 𝑠 2 ejemplo
Obtén la varianza de los siguientes datos de la serie:
9, 3, 8, 8, 9, 8, 9, 9, 18
1. Se calcula la media.
Media para datos no agrupados
𝑥𝑖 +𝑥2 +𝑥3 + … 𝑥𝑛 σ𝑛
𝑖=1 𝑥𝑖
𝑥ҧ = =
𝑛 𝑛
9 +3+8+8+9+8+9+9+18 81
𝑥ҧ = = =9
9 9
2. Al obtener la media ya podemos calcular la varianza, sustituyendo la fórmula
Varianza de datos aleatorios
Σ (𝑋 − 𝜇)2
𝜎2 =
𝑁
2
(9 − 9)2 + (3 − 9)2 + (8 − 9)2 + (8 − 9)2 + (9 − 9)2 + (8 − 9)2 + (9 − 9)2 + (9 − 9)2 + (18 − 9)2
𝜎 =
9
2
(0)2 + ( −6)2 +(−1)2 + (−1)2 + (0)2 + (−1)2 + (0)2 + (0)2 + (9)2
𝜎 =
9
Varianza 𝜎 2 / 𝑠 2 ejemplo
Continuación…
Obtén la varianza de los siguientes datos de la serie:
9, 3, 8, 8, 9, 8, 9, 9, 18
2. Al obtener la media ya podemos calcular la varianza, sustituyendo la fórmula
Varianza de datos aleatorios
Σ (𝑋 − 𝜇)2
𝜎2 =
𝑁
2
(9 − 9)2 + (3 − 9)2 + (8 − 9)2 + (8 − 9)2 + (9 − 9)2 + (8 − 9)2 + (9 − 9)2 + (9 − 9)2 + (18 − 9)2
𝜎 =
9
2
(0)2 + ( −6)2 +(−1)2 + (−1)2 + (0)2 + (−1)2 + (0)2 + (0)2 + (9)2
𝜎 =
9
0 + 36 + 1 + 1 + 0 + 1 + 0 + 0 + 81
𝜎2 =
9
120
𝜎2 = = 13.3333
9
3. Interpretamos
Los datos brindados tienen una µ (media) de 9 y una 𝜎 2 (varianza) de 13.3333
Varianza 𝜎 2 / 𝑠 2
Datos agrupados: ejemplo
Calculemos la varianza de nuestro ejercicio:
Intervalos Frecuencia Marca de Clase 𝑀𝑖
10 - 19 4
20 - 29 7 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟+𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
30 - 39 9 𝑀𝑖 =
2
40 - 49 10
𝐿𝑖𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟+𝐿𝑖𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
50 - 59 5 𝑀𝑖 =
35 2
1. Se calcula la media de los datos agrupados
Intervalos Frecuencia 𝒇𝒊 Marca de clase 𝑴𝒊 𝒇𝒊 𝑴𝒊
10 - 19 4 10 + 19 / 2 = 14.5 4 * 14.5 = 58
20 - 29 7 20 + 29 / 2 = 24.5 7 * 24.5 = 171.5
30 - 39 9 30 + 39 / 2 = 34.5 9 * 34.5 = 310.5
40 - 49 10 40 + 49 / 2 = 44.5 10 * 44.5 = 445
50 - 59 5 50 + 59 / 2 = 54.5 5 * 54.5 = 272.5
35 1257.5
Media para datos agrupados 1257.5
𝑥ҧ = = 35.9285
35
σ𝑘
𝑖=1 𝑓𝑖 𝑀𝑖
𝑥ҧ = La media aritmética de los datos es 35.9285
𝑛
Varianza 𝜎 2 / 𝑠 2
Datos agrupados: ejemplo
2. Se calcula la varianza de los datos agrupados a partir de la fórmula
1257.5
𝑥ҧ = = 35.9285
35
Frecuencia Marca de
Intervalos 𝒇𝒊 𝑴𝒊 𝒙𝒊 − 𝝁 (𝒙𝒊 − 𝝁)𝟐
𝒇𝒊 clase 𝑴𝒊
10 - 19 4 14.5 4 * 14.5 = 58 14.5 - 35.9285 = -21.4285 -21.4285 * -21.4285 = 459.1806
20 - 29 7 24.5 7 * 24.5 = 171.5 24.5 - 35.9285 = -11.4285 -11.4285 * -11.4285 = 130.6106
30 - 39 9 34.5 9 * 34.5 = 310.5 34.5 - 35.9285 = 1.4285 1.4285 * 1.4285 = 2.0406
40 - 49 10 44.5 10 * 44.5 = 445 44.5 - 35.9285 = 8.5715 8.5715 * 8.5715 = 73.4706
50 - 59 5 54.5 5 * 54.5 = 272.5 54.5 - 35.9285 = 18.5715 18.5715 * 18.5715 = 344.9006
35 1257.5
𝒇 (𝒙𝒊 − 𝝁)𝟐
4 * 459.1806 = 1836.7224
7 * 130.6106 = 914.2742
9 * 2.0406 = 18.3654
10 * 73.4706 = 734.706
5 * 344.9006 = 1724.503
5228.571
Varianza de datos agrupados
5228.571
2
Σ 𝑓(𝑋 − 𝜇)2 𝜎2 = 𝜎 2 = 149.3877
𝜎 = 35
𝑁
La varianza de los datos es 149.3877
Desviación estándar σ / s (sigma)
La desviación estándar o desviación típica es la raíz cuadrada de la varianza; es
decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de la
desviación.
Es una medida para la dispersión de los datos con base en la media aritmética
Datos no agrupados
σ𝑛 ҧ 2
𝑖=1 (𝑥1 − 𝑥)
σ=
𝑛
Datos agrupados o σ = 𝜎2
σ𝑛 ҧ 2 ∗𝑓𝑖
𝑖=1 (𝑥1 − 𝑥)
σ=
𝑛
Desviación estándar σ / s: ejemplo
Obtén la desviación estándar de los siguientes datos de la serie:
9, 3, 8, 8, 9, 8, 9, 9, 18
1. Se calcula la media.
Media para datos no agrupados
𝑥𝑖 +𝑥2 +𝑥3 + … 𝑥𝑛 σ𝑛
𝑖=1 𝑥𝑖
𝑥ҧ = =
𝑛 𝑛
9 +3+8+8+9+8+9+9+18 81
𝑥ҧ = = =9
9 9
2. Al obtener la media ya podemos calcular la varianza, sustituyendo la fórmula
Varianza de datos aleatorios
Σ (𝑋 − 𝜇)2
𝜎2 =
𝑁
2
(9 − 9)2 + (3 − 9)2 + (8 − 9)2 + (8 − 9)2 + (9 − 9)2 + (8 − 9)2 + (9 − 9)2 + (9 − 9)2 + (18 − 9)2
𝜎 =
9
2
(0)2 + ( −6)2 +(−1)2 + (−1)2 + (0)2 + (−1)2 + (0)2 + (0)2 + (9)2
𝜎 =
9
Desviación estándar σ / s: ejemplo
Continuación…
0 + 36 + 1 + 1 + 0 + 1 + 0 + 0 + 81
𝜎2 =
9
120
𝜎2 = = 13.3333
9
3. Calculamos la desviación estándar, sustituyendo la fórmula
σ = 𝜎2
σ = 13.3333
σ = 3.6514
4. Interpretamos
Los datos brindados tienen una µ (media) de 9, una 𝜎 2 (varianza) de 13.3333 y
una σ (desviación estándar) de 3.6514
Desviación estándar σ / s : ejemplo
Datos agrupados: ejemplo
1. Se calcula la media y la varianza de los datos.
1257.5
𝑥ҧ = = 35.9285
35
Frecuencia Marca de
Intervalos 𝒇𝒊 𝑴𝒊 𝒙𝒊 − 𝝁 (𝒙𝒊 − 𝝁)𝟐
𝒇𝒊 clase 𝑴𝒊
10 - 19 4 14.5 4 * 14.5 = 58 14.5 - 35.9285 = -21.4285 -21.4285 * -21.4285 = 459.1806
20 - 29 7 24.5 7 * 24.5 = 171.5 24.5 - 35.9285 = -11.4285 -11.4285 * -11.4285 = 130.6106
30 - 39 9 34.5 9 * 34.5 = 310.5 34.5 - 35.9285 = 1.4285 1.4285 * 1.4285 = 2.0406
40 - 49 10 44.5 10 * 44.5 = 445 44.5 - 35.9285 = 8.5715 8.5715 * 8.5715 = 73.4706
50 - 59 5 54.5 5 * 54.5 = 272.5 54.5 - 35.9285 = 18.5715 18.5715 * 18.5715 = 344.9006
35 1257.5
𝒇 (𝒙𝒊 − 𝝁)𝟐
4 * 459.1806 = 1836.7224
7 * 130.6106 = 914.2742
9 * 2.0406 = 18.3654
10 * 73.4706 = 734.706
5 * 344.9006 = 1724.503
5228.571
Varianza de datos agrupados
5228.571
2
Σ 𝑓(𝑋 − 𝜇)2 𝜎2 = 𝜎 2 = 149.3877
𝜎 = 35
𝑁
La varianza de los datos es 149.3877
Desviación estándar σ / s : ejemplo
2. Calculamos la desviación estándar, sustituyendo la fórmula
σ = 𝜎2
σ = 149.3877
σ = 12.2224
3. Interpretamos
Los datos brindados tienen una µ (media) de 35.9285, una 𝜎 2 (varianza) de
149.3877 y una σ (desviación estándar) de 12.2224
Coeficiente de variación
Determina el grado de dispersión de un conjunto de datos relativo a su media.
Se calcula dividiendo la desviación estándar de una distribución por su media y
multiplicando por 100
Datos aleatorios
𝑠
𝐶𝑉 = (100)
𝑥ҧ
Datos agrupados
σ
𝐶𝑉 = (100)
µത
Coeficiente de variación
Continuando con el ejercicio de datos
no agrupados
Obtén el coeficiente de variación (CV) de los siguientes datos de la serie:
9, 3, 8, 8, 9, 8, 9, 9, 18
Previamente obtuvimos:
Los datos brindados tienen una µ (media) de 9, una 𝜎 2 (varianza) de 13.3333 y
una σ (desviación estándar) de 3.6514
Datos aleatorios
𝑠
𝐶𝑉 = (100)
𝑥ҧ
3.6514
𝐶𝑉 = (100)
9 Interpretamos:
𝐶𝑉 = 0.4057 (100) Los datos brindados tienen una µ (media) de
9, una 𝜎 2 (varianza) de 13.3333, una σ
𝐶𝑉 = 40.57% (desviación estándar) de 3.6514 y un CV
(coeficiente de variación) de 40.57%
Coeficiente de variación
Continuando con el ejercicio de datos
agrupados
Frecuencia Marca de
Intervalos 𝒇𝒊 𝑴𝒊 𝒙𝒊 − 𝝁 (𝒙𝒊 − 𝝁)𝟐
𝒇𝒊 clase 𝑴𝒊
10 - 19 4 14.5 4 * 14.5 = 58 14.5 - 35.9285 = -21.4285 -21.4285 * -21.4285 = 459.1806
20 - 29 7 24.5 7 * 24.5 = 171.5 24.5 - 35.9285 = -11.4285 -11.4285 * -11.4285 = 130.6106
30 - 39 9 34.5 9 * 34.5 = 310.5 34.5 - 35.9285 = 1.4285 1.4285 * 1.4285 = 2.0406
40 - 49 10 44.5 10 * 44.5 = 445 44.5 - 35.9285 = 8.5715 8.5715 * 8.5715 = 73.4706
50 - 59 5 54.5 5 * 54.5 = 272.5 54.5 - 35.9285 = 18.5715 18.5715 * 18.5715 = 344.9006
35 1257.5
𝒇 (𝒙𝒊 − 𝝁)𝟐
4 * 459.1806 = 1836.7224 Previamente obtuvimos:
7 * 130.6106 = 914.2742 Los datos brindados tienen una µ (media) de 35.9285, una 𝜎 2
9 * 2.0406 = 18.3654
10 * 73.4706 = 734.706
(varianza) de 149.3877 y una σ (desviación estándar) de 12.2224
5 * 344.9006 = 1724.503
5228.571
Datos aleatorios
𝑠
𝐶𝑉 = (100)
𝑥ҧ
𝐶𝑉 =
12.2224
(100) Interpretamos:
35.9285 Los datos brindados tienen una µ (media) de 35.9285, una 𝜎 2
𝐶𝑉 = 0.3401 (100) (varianza) de 149.3877 y una σ (desviación estándar) de
𝐶𝑉 = 34.01% 12.2224 y un CV (coeficiente de variación) de 34.01%
Índice de Kurtosis
Es una medida de dispersión con la que vamos a conocer que tan centrados o
dispersos se encuentran los datos alrededor de la media. El resultado nos
ayudará a pronosticar el tipo de curva de distribución de los datos.
Para el caso de datos no agrupados, la kurtosis poblacional y muestral se
expresan mediante las siguientes fórmulas.
4 4
Σ 𝑋𝑗 − 𝜇 Σ 𝑋𝑗 − 𝑥ҧ
( ) ( 𝑛 −1 )
𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 𝑁 𝛼4𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 =
(𝜎)4 (𝑆)4
Para el caso de datos agrupados, la kurtosis poblacional y muestral se expresan
mediante las siguientes fórmulas.
4
Σ 𝑚𝑗 − 𝜇 𝑓
( )
𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 𝑁
(𝜎)4
4
Σ 𝑚𝑗 − 𝑥ҧ 𝑓
( )
𝛼4𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 −1
(𝑆)4
Índice de Kurtosis
4 4
Σ 𝑚𝑗 − 𝜇 𝑓 Σ 𝑚𝑗 − 𝑥ҧ 𝑓
( ) ( )
𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 𝑁 𝛼4𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 −1
(𝜎)4 (𝑆)4
Donde:
𝛼4 Coeficiente de kurtosis 𝑛 Tamaño de la muestra
𝑚𝑗 Punto medio de clase 𝑁 Tamaño de la población
𝑥ҧ Media de la muestra 𝜎 Desviación estándar poblacional
𝑓 Frecuencia de la clase 𝑆 Desviación estándar de la muestra
𝜇 Media poblacional
Indice de Kurtosis
Se desea determinar la variabilidad e índice de kurtosis del gasto de
transporte en pesos, que hacen los alumnos del grupo de estadística.
Para ello se agruparon los datos como se muestra en la tabla. La media poblacional
calculada es de 35.9285. Calcula lo solicitado.
Frecuencia Marca de
Intervalos 𝒇𝒊 𝑴𝒊 𝒙𝒊 − 𝝁 (𝒙𝒊 − 𝝁)𝟐
𝒇𝒊 clase 𝑴𝒊
10 - 19 4 14.5 4 * 14.5 = 58 14.5 - 35.9285 = -21.4285 -21.4285 * -21.4285 = 459.1806
20 - 29 7 24.5 7 * 24.5 = 171.5 24.5 - 35.9285 = -11.4285 -11.4285 * -11.4285 = 130.6106
30 - 39 9 34.5 9 * 34.5 = 310.5 34.5 - 35.9285 = 1.4285 1.4285 * 1.4285 = 2.0406
40 - 49 10 44.5 10 * 44.5 = 445 44.5 - 35.9285 = 8.5715 8.5715 * 8.5715 = 73.4706
50 - 59 5 54.5 5 * 54.5 = 272.5 54.5 - 35.9285 = 18.5715 18.5715 * 18.5715 = 344.9006
35 1257.5
𝒇 (𝒙𝒊 − 𝝁)𝟐 (𝒙𝒊 − 𝝁)𝟒 𝒇 (𝒙𝒊 − 𝝁)𝟒
4 * 459.1806 = 1836.7224 459.1806 * 459.1806 = 210846.823 210846.823 * 4 = 843387.292
7 * 130.6106 = 914.2742 130.6106 * 130.6106 = 17059.1288 17059.1288 * 7 = 119413.902
9 * 2.0406 = 18.3654 2.0406 * 2.0406 = 4.1640 4.1640 * 9 = 37.476
10 * 73.4706 = 734.706 73.4706 * 73.4706 = 5397.9290 5397.9290 * 10 = 53979.29
5 * 344.9006 = 1724.503 344.9006 * 344.9006 = 118956.424 118956.424 * 5 = 594782.119
5228.571 1611600.08
Previamente obtuvimos:
Los datos brindados tienen una µ (media) de 35.9285, una 𝜎 2 (varianza) de 149.3877 y una σ (desviación estándar) de 12.2224
4 1611600.08 (46045.7166)
Σ 𝑚𝑗 − 𝜇 𝑓 ( ) 𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 =
( ) 𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 35 22316.4942
𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 𝑁
(12.2224)4
(𝜎)4
𝛼4𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 2.0633
Los datos brindados tienen una µ (media) de 35.9285, una 𝜎 2 (varianza) de 149.3877, una σ (desviación estándar) de 12.2224 y
un índice de kurtosis de 2.0633, teniendo una distribución platicúrtica
Interpretación
Indice de Kurtosis
La interpretación del índice de kurtosis se define según el caso que se trate:
𝛼>3 𝛼<3
Cuando es de mayor 𝛼=3
No es ni tan puntiaguda, Esta distribución cuando
apuntamiento es muy chata o
(puntiaguda) de una ni tan plana
distribución. aplanada, se dice que
Los datos se encuentran existe una gran
muy concentrados dispersión de los datos
alrededor de la media alrededor de la media
Recomendaciones Generales
1. Antes de hacer una evaluación o actividad ingresa a las sesiones de
Open Class (OC) disponibles.
2. Observa atentamente los videos, las sesiones quedan grabadas,
repasa las veces necesarias para consolidar el tema.
3. Recuerda estar en un lugar sin distracciones para que puedas
concentrarte en tus evaluaciones.
4. Tengan las fórmulas a la mano para que puedan ir sustituyendo.
5. Estudiantes que están en modalidad de exámenes, pueden realizar
los exámenes de segunda vuelta.
¡Éxito!
Pregunta de investigación
Con base a lo expuesto durante la sesión:
¿De qué manera las medidas de dispersión te dan los elementos
suficientes para afirmar o rechazar una suposición?
Recuerde utilizar el formato UTEL, respetando las
características de la escritura de las actividades a
entregar:
• Extensión una cuartilla
• Presentar referencias en estilo APA