Estadística 2
Estadística 2
∑ 𝒙𝒊
Media poblacional 𝝁=
𝑵
Media muestral =
Donde:
µ = media poblacional
= media muestral
xi = cada una de las observaciones de la población o muestra
28
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
Solución:
Media muestral = =
EJEMPLO
Solución:
Es una población, ya que se consideran todos los empleados de la empresa.
Media aritmética µ =
∑ 𝒇𝒊 𝒙𝒊
Poblacional 𝝁=
𝑵
Muestral
Donde:
µ = media poblacional
= media muestral
fi = frecuencia de la clase o intervalo i
29
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
SOLUCIÓN
∑ 𝒇𝒊 𝒙𝒊
𝝁=
𝑵
30
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
∑ 𝒇𝒊 𝒙𝒊 𝟐𝟎𝟔𝟎
𝝁= = = 34.33
𝑵 𝟔𝟎
EJEMPLO
Se tienen las edades de 7 personas: 18, 21, 14, 22, 17, 16 y 19. Encontrar la
mediana de estas edades.
Solución:
Se ordenan los datos de menor a mayor: 14 16 17 18 19 21 22
EJEMPLO
Se tienen las edades de 8 personas: 21, 17, 19, 20, 26, 15, 22 y 24
Solución:
Se ordenan los datos de menor a mayor: 15 17 19 20 21 22 24 26
Donde:
LRi = Límite real inferior de la clase donde se localiza la mediana
31
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
Solución:
Para obtener la mediana, primero se localiza la clase que la contiene. Ya que
N=60 la clase mediana se ubica según N/2 = 30 o en el 50% de la población,
la cual se localiza en el intervalo 30 – 39.
32
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
LRi = 29.5
i = 10
N = 60
f’acum= 20
fmed = 20
EJEMPLO
Solución:
Los datos se encuentran ordenados de menor a mayor, el valor que se repite
es el 61.
Por lo tanto la moda
EJEMPLO
33
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Solución:
Se ordenan los datos 6, 7, 8, 8, 9, 9, 10
Son dos valores que se repiten el mismo número de veces, por lo que
tenemos un caso bimodal ( 2 modas):
1
xˆ LRi i
1 2
donde:
EJEMPLO
34
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Solución:
La clase modal se localiza en el intervalo de 30 a 39, ya que tiene la
frecuencia mayor.
LRi = 29.5
i = 10
1 = 20 – 13 = 7
2 = 20 – 14 = 6
1
xˆ LRi i
1 2
M.G. =
𝒏
M.G. = (𝒙𝟏 )(𝒙𝟐 )(𝒙𝟑 ) … (𝒙𝒏 )
EJEMPLO
Los porcentajes de inflación en los últimos 5 años han sido 17%, 16%, 15%,
18 % y 19% respectivamente. Determine el porcentaje promedio de inflación
anual en el periodo.
Solución:
Los valores de inflación están referidos a la unidad, deben expresarse en
términos de factores de incrementos de precios, 17% equivale a 1.17, 16% a
1.16, 15% a 1.15, 18% a 1.18, y 19% a 1.19. La media geométrica de los datos
es el valor promedio del incremento los precios:
35
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Datos no agrupados:
Algunas medidas se utilizan para describir la posición que tiene un
determinado valor en un conjunto de datos, por lo que dividen al conjunto
de datos en partes iguales. Las medidas de posición más usuales son tres:
cuartiles , deciles y percentiles.
Ubicación de un percentil LC = (n + 1)
Donde:
EJEMPLO
$158 $200 $130 $260 $180 $190 $340 $290 $230 $300 $180
Solución:
36
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
L25 = (11 + 1)
Por lo que Q1 se localiza en el lugar 3 y su valor es
Q1 = $180
L75 = (11 + 1)
EJEMPLO
a) Determine Q1, Q2 y Q3
b) Obtenga el decil 2 (D2)
c) Calcule el percentil 87 (P87)
Solución:
Se ordenan los datos de menor a mayor
12 13 15 21 24 27
31 32 33 35 43 47
55 59 62 67 73 74
a) Calculo de Q1
Se localiza la posición de Q1 donde C=25 y n =18
L25 = (18 + 1)
Por lo que Q1 se ubica entre el cuarto y quinto valor que son 21 y 24,
por lo que la distancia entre estos valores es 3. Para obtener el valor
del primer cuartil se multiplica 0.75x3 = 2.25 y se le suma a 21,
quedando el valor de
Q1= 23.25
Calculo de Q2 (mediana), donde C=50 y n=18
37
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Q2 =
Calculo de Q3
Q3= 59.75
L87 = (18 + 1)
Se ubica en las observaciones 67 y 73, cuya distancia es 6
6 (0.53) = 3.18
P87= 67 +3.18 = 70.18
Datos agrupados:
Para calcular los cuantiles (Ci) para datos agrupados se utiliza la fórmula de
la mediana.
Ci = LRi + i
Donde:
38
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Rango Medio =
Eje medio =
EJEMPLO
Obtener:
39
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Calculo de Q1, Q2 y Q3
Los cuantiles se calculan con la fórmula
Ci = LRi + i
40
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Rango Medio = =
Eje medio = =
Diagrama caja-bigote.
El diagrama caja-bigote, también llamado de líneas y bloques, es una
representación gráfica que ayuda a ilustrar un conjunto de datos. Para
elaborar el diagrama se necesitan 5 valores estadísticos:
xmenor = valor mínimo
Q1 = Cuartil 1
= mediana
Q3= Cuartil 3
xmayor = valor máximo
EJEMPLO
xmenor = 3
Q1 = 7.7059
= 10.2727
Q3= 12.9166
41
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
xmayor = 20
Solución:
Para elaborar el diagrama caja-bigote, primero se establece una escala
adecuada en el eje horizontal. Después se dibuja un rectángulo que es la
caja, que parte de Q1 (7.7059 llamadas) y termina en Q3 (12.9166 llamadas).
Dentro de la caja se marca un segmento vertical que representa la mediana
(10.2727). Después se trazan dos líneas horizontales, una desde la caja hasta
el valor mínimo (3) y otra hasta el valor máximo (20).
= 10.2727
0 22
42
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
43
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
Solución:
P10= 5
P90= 35
Rango interpercentílico = P90 – P10 = 35 – 5 = 30
44
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
DM =
Donde:
EJEMPLO
35 46 49 53 59 68 40
Solución:
𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙|
𝒙𝒊
35 35-50= -15 15
46 46-50= -4 4
49 49-50= -1 1
53 53-50= 3 3
59 59-50= 9 9
68 68-50= 18 18
40 40-50= -10 10
Total ∑|𝒙𝒊 − 𝒙| =60
45
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
= (35+46+49+53+59+68+40) / 7 =350 / 7 = 50
∑|𝒙𝒊 𝒙|
DM =
𝒏
∑|𝒙𝒊 𝒙| 𝟔𝟎
DM = = = 8.57
𝒏 𝟕
∑𝒇𝒊 |𝒙𝒊 𝒙|
DM =
𝒏
Donde:
xi = marca de clase
𝒇𝒊 = frecuencia de cada clase
𝒙 = media aritmética de los valores
n = numero de observaciones de la muestra
= indica el valor absoluto
EJEMPLO
46
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Solución:
𝟖𝟐𝟓𝟎
𝒙=
= 𝟔𝟖. 𝟕𝟓
𝟏𝟐𝟎
La desviación media para datos agrupados de una muestra es:
La desviación media de 23.96 pesos, quiere decir que el costo promedio del
estacionamiento de 23.96 pesos varía con respecto a la media de 68.75
pesos diarios.
Datos no agrupados.
Varianza poblacional
Donde:
= varianza de la población
=media de la población
=valor de cada observación
N= tamaño de la población
Varianza muestral
∑(𝒙𝒊 − 𝒙)𝟐
𝟐
𝒔 =
𝒏−𝟏
donde:
s2 = varianza de la muestra
= media de la muestra
=valor de cada observación
n = tamaño de la muestra
Datos agrupados.
Varianza poblacional
=frecuencia de la clase i
=punto medio de la clase i (marca de clase)
=media de la población
N= tamaño de la población
Varianza muestral
𝟐
∑ 𝒇𝒊 (𝒙𝒊 − 𝒙)𝟐
𝒔 =
𝒏−𝟏
48
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
=frecuencia de la clase i
=punto medio de la clase i (marca de clase)
= media de la muestra
n = tamaño de la muestra
Datos no agrupados.
Datos agrupados
49
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Fórmulas directas:
Datos no agrupados
Varianza muestral:
Datos agrupados.
Varianza muestral:
EJEMPLO
Solución:
Costos
hora-hombre
5 5-12=-7 49
7 7-12=-5 25
10 10-12=-2 4
15 15-12=3 9
23 23-12=11 121
0 (𝐱𝐢 − 𝐱)𝟐 = 𝟐𝟎𝟖
50
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Varianza:
Desviación estándar:
EJEMPLO
0
1
2
3
5 4
51
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Ortiz Pineda
Puntos Frecuencia Puntos Frecuencia
Xi fi Xi fi
5 1 5 4
4 8 4 9
3 14 3 7
2 5 2 5
1 1 1 3
0 1 0 2
Total 30 Total 30
Solución:
Se calcula la varianza y la desviación estándar con las fórmulas de varianza
( ) y desviación estándar poblacional ( ) para datos agrupados
considerando como el valor de cada observación y no como la marca de
clase.
5 1 5 2 4 4
4 8 32 1 1 8
3 14 42 0 0 0
2 5 10 -1 1 5
1 1 1 -2 4 4
0 1 0 -3 9 9
Total 30
52
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Varianza
Desviación estándar
5 4 20 2 4 16
4 9 36 1 1 9
3 7 21 0 0 0
2 5 10 -1 1 5
1 3 3 -2 4 12
0 2 0 -3 9 18
Total 30
Obtención de la media:
Varianza
Desviación estándar
53
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Ortiz es mejor tirador, ya que tiene menos dispersión en sus tiros, aunque
tenga el mismo promedio que Pineda.
EJEMPLO
Cantidad Número de
Ahorrada empleados
(miles de pesos)
1-3 2
3-5 6
5-7 13
7-9 6
9-11 3
Total 30
Cantidad Número de
Ahorrada Empleados (marca
(miles de de
pesos) clase)
1-3 2 2 4 2x4=8
3-5 6 4 24 4x24=96
5-7 13 6 78 6x78=468
7-9 6 8 48 8x48=384
9-11 3 10 30 10x30=300
Total 30 =184 =1256
Varianza muestral:
= =4.395
Desviación estándar muestral:
54
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
= = 2.096
55
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
EJEMPLO
Solución:
a) Aproximadamente el 68% de las cuentas de consumo de energía
eléctrica están entre $6000 y $10 600, que se obtienen por:
𝝁 ± 𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟐𝟑𝟎𝟎
56
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
𝝁 ± 𝟐𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟐(𝟐𝟑𝟎𝟎)
𝝁 ± 𝟑𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟑(𝟐𝟑𝟎𝟎)
57
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Solución:
Para los administradores:
𝒔
𝑪𝑽 = (𝟏𝟎𝟎)
𝒙
𝟏𝟓𝟎𝟎
𝑪𝑽 = 𝟏𝟓𝟎𝟎𝟎
(𝟏𝟎𝟎) = 10%
58
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
ASIMETRÍA.
Cuando una curva de distribución de frecuencias es simétrica se le llama
normal o campana de Gauss y se presenta siempre cuando la media
mediana y moda son iguales.
∑ 𝒇𝒊 𝒙𝒊
m 1 = media = 𝝁=
𝑵
59
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Coeficiente de Sesgo=
Donde:
Simétrica
Coeficiente de sesgo = 0
60
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
3(media mediana)
Coeficiente de sesgo de Pearson =
desviación _ estándar
CURTOSIS.
La curtosis nos determina el grado de apuntamiento de una distribución
de frecuencias.
Las figuras siguientes nos muestran las formas de las distribuciones
normales. La curva (1) cuya característica es una concentración de
datos en el centro de distribución con poca dispersión, se le llama
distribución leptocúrtica. La curva (2) tiene la forma ideal de una curva
normal y se conoce como distribución mesocúrtica. La curva (3) es una
distribución muy heterogénea con mucha dispersión y es conocida como
platicúrtica.
61
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Coeficiente de curtosis.
Coeficiente de curtosis =
Donde:
EJEMPLO
Ortiz
Puntos Frecuencia
Xi fi
5 1
4 8
3 14
2 5
1 1
0 1
Total 30
62
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Solución:
8 8 16 16
1 8 1 8
0 0 0 0
-1 -5 1 5
-8 -8 16 16
-27 -27 81 81
Total 𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟑 = −𝟐𝟒 𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟒 = 𝟏𝟐𝟔
∑ 𝒇𝒊 𝒙𝒊 𝟗𝟎
𝝁= = =3
𝑵 𝟑𝟎
Varianza
𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐 𝟑𝟎
𝝈𝟐 = = =𝟏
𝑵 𝟑𝟎
Desviación estándar
𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐 𝟑𝟎
𝝈= = = √𝟏 = 𝟏
𝑵 𝟑𝟎
63
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García
Coeficiente de Sesgo
𝒎𝟑 𝟎.𝟖𝟎
Coeficiente de Sesgo= = = −𝟎. 𝟖𝟎
𝝈𝟑 (𝟏)𝟑
Coeficiente de curtosis
.
Coeficiente de curtosis = = = 4.2
( )
64