[go: up one dir, main page]

0% encontró este documento útil (0 votos)
138 vistas37 páginas

Estadística 2

Este documento presenta una guía sobre medidas estadísticas descriptivas. Explica medidas de tendencia central como la media, mediana y moda, así como medidas de dispersión como rango, desviación estándar y coeficiente de variación. Proporciona fórmulas y ejemplos para calcular estas medidas a partir de datos agrupados y no agrupados.

Cargado por

Esteban Cayetano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
138 vistas37 páginas

Estadística 2

Este documento presenta una guía sobre medidas estadísticas descriptivas. Explica medidas de tendencia central como la media, mediana y moda, así como medidas de dispersión como rango, desviación estándar y coeficiente de variación. Proporciona fórmulas y ejemplos para calcular estas medidas a partir de datos agrupados y no agrupados.

Cargado por

Esteban Cayetano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 37

Guía de Estudio de Estadística Descriptiva Ma.

Adriana Morales García

2. MEDIDAS ESTADÍSTICAS DE RESUMEN

2.1 Medidas de tendencia central y posición


2.1.1 Media, mediana y moda
2.1.2 Media geométrica
2.1.3 Cuantiles: cuartiles, deciles y percentiles
2.1.4 Rango medio y eje medio
2.1.5 Representación gráfica de las medias de tendencia central y
posición.Diagrama caja-bigote

2.2. Medidas de dispersión y forma

2.2.1 Rango, rango intercuartílico, rango interpercentílico


2.2.2 Desviación media, varianza y desviación estándar
2.2.3 Regla empírica
2.2.4 Coeficiente de variación
2.2.5 Coeficiente de asimetría y curtosis

2.-MEDIDAS ESTADÍSTICAS DE RESUMEN

2.1 Medidas de tendencia central y posición

2.1.1 Media, mediana y moda

Las medidas de tendencia central son valores del centro de la distribución


de frecuencias y nos da un valor de comparación de todas las observaciones
determinadas por la población o muestra bajo estudio. Las tres medidas que
más comúnmente se utilizan son la media, mediana y moda.

Media Aritmética para datos no agrupados.- Es un valor central que se


obtiene al calcular el promedio aritmético de un conjunto de datos.
Se utiliza (x barra) si se obtuvo de una muestra y µ (letra griega “mu”) si la
medida se obtiene de la población.

∑ 𝒙𝒊
Media poblacional 𝝁=
𝑵

Media muestral =

Donde:
µ = media poblacional
= media muestral
xi = cada una de las observaciones de la población o muestra

28
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

N = número total de observaciones de la población


n = número total de observaciones de la muestra
∑ = suma de cada una de las observaciones

EJEMPLO

Determine el salario medio por hora pagado a una muestra de 6 electricistas


que obtuvieron los siguientes ingresos (en pesos)
$158, $239, $189, $324, $279, $360

Solución:
Media muestral = =

EJEMPLO

Se tienen 12 vendedores de autos en una agencia Nissan. Las cantidades de


autos vendidos el último mes del año fueron: 18, 23, 11, 17, 21, 19, 12, 12, 5,
8, 13, 14. Calcule la media aritmética de los autos vendidos. Es una
población o muestra.

Solución:
Es una población, ya que se consideran todos los empleados de la empresa.
Media aritmética µ =

Media Aritmética para datos agrupados por frecuencias (media ponderada).-


Se utiliza cuando hay varias observaciones con un mismo valor y los datos
se han agrupado en una distribución de frecuencias.

Media Aritmética para datos agrupados por intervalos.

∑ 𝒇𝒊 𝒙𝒊
Poblacional 𝝁=
𝑵

Muestral

Donde:
µ = media poblacional
= media muestral
fi = frecuencia de la clase o intervalo i

29
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

xi = marca de clase (valor central) del intervalo


N = número total de observaciones de la población
n = número total de observaciones de la muestra
∑fixi = Suma del producto fixi

EJEMPLO

A continuación se presenta una distribución de frecuencias de los gastos en


publicidad de 60 compañías productoras. Calcule la media de los gastos de
publicidad.

Gastos en Publicidad Número de


(millones de pesos) compañías
10 -19 7
20-29 13
30-39 20
40-49 14
50-59 6
Total 60

SOLUCIÓN

Se considera la media poblacional

∑ 𝒇𝒊 𝒙𝒊
𝝁=
𝑵

Número de Marca de clase


Clases compañías
fi xi fixi
10 -19 7 14.5 101.5
20-29 13 24.5 318.5
30-39 20 34.5 690
40-49 14 44.5 623
50-59 6 54.5 327
Total 60 ∑fixi=2060

30
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

∑ 𝒇𝒊 𝒙𝒊 𝟐𝟎𝟔𝟎
𝝁= = = 34.33
𝑵 𝟔𝟎

Mediana para datos no agrupados.- La mediana (Me o ) de un conjunto


de datos se define como el valor del dato que cae en el centro, cuando los
datos se ordenan en forma creciente o decreciente. Si el número de datos es
par, se escoge como mediana el promedio de las dos observaciones
centrales, si el valor es impar el valor de la mediana es único.

La mediana se localiza en el lugar

EJEMPLO

Se tienen las edades de 7 personas: 18, 21, 14, 22, 17, 16 y 19. Encontrar la
mediana de estas edades.

Solución:
Se ordenan los datos de menor a mayor: 14 16 17 18 19 21 22

La mediana se localiza en el lugar


Por lo tanto, el valor de la mediana

EJEMPLO

Se tienen las edades de 8 personas: 21, 17, 19, 20, 26, 15, 22 y 24

Solución:
Se ordenan los datos de menor a mayor: 15 17 19 20 21 22 24 26

La mediana se localiza en el lugar


Como el número de datos es par el valor de la mediana es el promedio de las

dos observaciones centrales

Mediana para datos agrupados por intervalos.

Donde:
LRi = Límite real inferior de la clase donde se localiza la mediana

31
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

i = longitud real de la clase donde se encuentra la mediana


N = número total de observaciones o frecuencia total
f’acum= frecuencia acumulada anterior a la clase que contiene a la mediana
fmed = frecuencia absoluta de la clase que contiene a la mediana

Primero se estima la mediana ubicando la clase en la cual se encuentra (N/2


o 50% de la población o muestra), para posteriormente interpolar calculando
su valor exacto a partir de la fórmula anterior.

EJEMPLO

Gastos en publicidad de 60 compañías productoras. Calcule la mediana de


los gastos de publicidad.

Gastos en Publicidad Número de


(millones de pesos) compañías
10 -19 7
20-29 13
30-39 20
40-49 14
50-59 6
Total 60

Solución:
Para obtener la mediana, primero se localiza la clase que la contiene. Ya que
N=60 la clase mediana se ubica según N/2 = 30 o en el 50% de la población,
la cual se localiza en el intervalo 30 – 39.

32
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Límites reales Número de Frecuencia


Clases de clase compañías acumulada
fi facum
10 -19 9.5-19.5 7 7
20-29 19.5-29.5 13 20
30-39 29.5-39.5 20 40
40-49 39.5-49.5 14 54
50-59 49.5-59.5 6 60
Total 60

LRi = 29.5
i = 10
N = 60
f’acum= 20
fmed = 20

= 29.5 + 10 = 29.5 + 5 = 34.5

Se concluye que el 50% de las compañías gastan en publicidad menos de


34.5 millones de pesos.

Moda para datos no agrupados.- La moda (Mo o ) es el valor o valores que


se repiten con mayor frecuencia en un conjunto de datos.

EJEMPLO

Encuentre la moda de los pesos en kilogramos de 6 personas:


49, 54, 61, 61, 65 y 69.

Solución:
Los datos se encuentran ordenados de menor a mayor, el valor que se repite
es el 61.
Por lo tanto la moda

EJEMPLO

Encuentre el valor de la moda de las siguientes calificaciones:


7, 6, 8, 9, 9, 8, 10

33
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Solución:
Se ordenan los datos 6, 7, 8, 8, 9, 9, 10
Son dos valores que se repiten el mismo número de veces, por lo que
tenemos un caso bimodal ( 2 modas):

Moda para datos agrupados por intervalos.

Se identifica la clase que contiene a la moda, llamada clase modal


que es la que contiene el mayor número de observaciones. La fórmula
siguiente interpola dentro de la clase modal:

 1 
xˆ  LRi  i  
 1   2 

donde:

LRi = Límite real inferior de la clase modal

i = ancho de la clase o intervalo de la clase modal

1 = Diferencia entre la frecuencia absoluta de la clase modal y la


frecuencia absoluta de la clase anterior a la clase modal.

2 = Diferencia entre la frecuencia absoluta de la clase modal y


la frecuencia absoluta de la clase posterior a la clase modal.

EJEMPLO

Gastos en publicidad de 60 compañías productoras. Calcule la moda de los


gastos de publicidad.

Gastos en Publicidad Número de


(millones de pesos) compañías
10 -19 7
20-29 13
30-39 20
40-49 14
50-59 6
Total 60

34
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Solución:
La clase modal se localiza en el intervalo de 30 a 39, ya que tiene la
frecuencia mayor.

LRi = 29.5
i = 10
1 = 20 – 13 = 7
2 = 20 – 14 = 6

 1 
xˆ  LRi  i  
 1   2 

= 29.5 + 10 = 29.5 + 10 = 29.5 + 10(0.5385) = 34.88

2.1.2 Media geométrica.

La media geométrica (MG) se utiliza para obtener el promedio de


porcentajes, razones, índices, tasas de crecimiento. Es útil en los negocios y
la economía, ya que siempre interesa determinar el cambio porcentual en
ventas, sueldos, o cifras económicas, como el Producto Nacional Bruto. La
media geométrica de una cantidad finita de n números es la raíz n-ésima del
producto de los valores.

M.G. =

𝒏
M.G. = (𝒙𝟏 )(𝒙𝟐 )(𝒙𝟑 ) … (𝒙𝒏 )

EJEMPLO

Los porcentajes de inflación en los últimos 5 años han sido 17%, 16%, 15%,
18 % y 19% respectivamente. Determine el porcentaje promedio de inflación
anual en el periodo.

Solución:
Los valores de inflación están referidos a la unidad, deben expresarse en
términos de factores de incrementos de precios, 17% equivale a 1.17, 16% a
1.16, 15% a 1.15, 18% a 1.18, y 19% a 1.19. La media geométrica de los datos
es el valor promedio del incremento los precios:

Incremento promedio = Media geométrica =


𝟓 𝟓
(𝟏. 𝟏𝟕)(𝟏. 𝟏𝟔)(𝟏. 𝟏𝟓)(𝟏. 𝟏𝟖)(𝟏. 𝟏𝟗) = √𝟐. 𝟏𝟗𝟏𝟔 = 1.1699

35
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Por lo que el porcentaje promedio de inflación anual es 16.99%

2.1.3. Cuantiles: cuartiles, deciles y percentiles.

Datos no agrupados:
Algunas medidas se utilizan para describir la posición que tiene un
determinado valor en un conjunto de datos, por lo que dividen al conjunto
de datos en partes iguales. Las medidas de posición más usuales son tres:
cuartiles , deciles y percentiles.

Cuartiles (Q).- dividen a la población en 4 partes iguales: primer cuartil Q1,


segundo cuartil Q2 y tercer cuartil Q3 que contienen 25%, 50% y 75% del
conjunto de observaciones respectivamente. El segundo cuartil Q2 es igual a
la mediana.

Deciles(D).- dividen a la población en 10 partes iguales.

Percentiles (P).- dividen a la población en 100 partes iguales

La mediana es igual al cuartil dos Q2, Decil 5 D5 y Percentil 50 P50

Para ubicar al cuantil deseado, lo podemos hacer por medio de la ubicación


del percentil

Ubicación de un percentil LC = (n + 1)

Donde:

LC = Localización del percentil o cuantil deseado


n = número total de observaciones
C = percentil o cuantil deseado

EJEMPLO

Salario diario de 11 empleados de un restaurante de comida rápida.

$158 $200 $130 $260 $180 $190 $340 $290 $230 $300 $180

Solución:

Primero se ordenan loas dato de menor a mayor


$130 $158 $180 $180 $190 $200 $230 $260 $290 $300 $340

36
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Para localizar al primer cuartil Q1 que es el 25 % de las observaciones, se

utiliza la fórmula LC = (n + 1) donde n=11 y C = 25

L25 = (11 + 1)
Por lo que Q1 se localiza en el lugar 3 y su valor es
Q1 = $180

El valor de la mediana es el la observación que se encuentra en el centro,


dicho valor está en la posición (n+1)/2 = (11+1)/2 = 6 y su valor es
Q2= = $200
Para localizar el tercer cuartil Q3 que es el 75 % de las observaciones

L75 = (11 + 1)

Y el valor del cuartil 3 es Q3= $290

EJEMPLO

A continuación se indica el tiempo en días que tardan los clientes en pagar


sus facturas en una empresa distribuidora de mobiliario para oficina
13 21 62 24 33 35
12 31 73 27 47 67
15 43 55 32 59 74

a) Determine Q1, Q2 y Q3
b) Obtenga el decil 2 (D2)
c) Calcule el percentil 87 (P87)

Solución:
Se ordenan los datos de menor a mayor

12 13 15 21 24 27
31 32 33 35 43 47
55 59 62 67 73 74

a) Calculo de Q1
Se localiza la posición de Q1 donde C=25 y n =18

L25 = (18 + 1)
Por lo que Q1 se ubica entre el cuarto y quinto valor que son 21 y 24,
por lo que la distancia entre estos valores es 3. Para obtener el valor
del primer cuartil se multiplica 0.75x3 = 2.25 y se le suma a 21,
quedando el valor de
Q1= 23.25
Calculo de Q2 (mediana), donde C=50 y n=18

37
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Se localiza en el lugar: L50 = (18 + 1)


Por lo que el valor de

Q2 =
Calculo de Q3

Se localiza en el lugar L75 = (18 + 1)


Se ubica en las observaciones 59 y 62, la distancia entre
ambas observaciones es 3. Después se multiplica esta
diferencia por 0.25 (3 x 0.25) = 0.75 y se le suma a 59, por lo que

Q3= 59.75

b) Calculo del segundo decil (D2). Son el 20% de las observaciones

Se localiza en el lugar: L20 = (18 + 1)


Se ubica entre las observaciones 15 y 21, la distancia entre ellas es 6
6x 0.8 = 4.8
D2= 15 + 4.8 = 19.8
c) Calculo del percentil 87 (P87)
Localización del percentil 87

L87 = (18 + 1)
Se ubica en las observaciones 67 y 73, cuya distancia es 6
6 (0.53) = 3.18
P87= 67 +3.18 = 70.18

Datos agrupados:

Para calcular los cuantiles (Ci) para datos agrupados se utiliza la fórmula de
la mediana.

Ci = LRi + i

Donde:

Ci = Cuantil de referencia (pueden ser cuartiles Q, deciles D o percentiles P)


LRi = Límite real inferior donde se encuentra el cuantil (cuartil, decil o
percentil)
i = tamaño de intervalo o clase donde se ubica el cuantil
j = cuantil de referencia
r = número de fracciones en que se divide a la población

38
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

facum = frecuencia acumulada de la clase anterior donde se localiza el cuantil


fabsj= frecuencia absoluta del intervalo donde se encuentra el cuantil
∑fi = suma de frecuencias (número total de observaciones)

2.1.4.- Rango medio y eje medio

El rango medio es una medida de tendencia central que permite ubicar el


centro a partir de los valores extremos. Se encuentra promediando los
valores mínimo (xmenor) y máximo (xmayor) del conjunto de datos

Rango Medio =

El eje medio es una medida de tendencia central y es el promedio de los


cuartiles 1 y 3 de un conjunto de datos

Eje medio =

EJEMPLO

Una empresa realizó el conteo de las llamadas telefónicas de sus 70


empleados en una semana.

Cantidad de llamadas Frecuencia


telefónicas
3-5 5
6-8 17
9-11 22
12-14 18
15-17 6
18-20 2
total 70

Obtener:

a) primer cuartil (Q1), mediana o Q2 y tercer cuartil (Q3)


b) tercer decil (D3)
c) percenti 93
d) Rango medio y eje medio

39
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

a) Primero se obtienen la frecuencia acumulada y frecuencia relativa


acumulada:

Clase Cantidad de Frecuencia Frecuencia Frecuencia relativa


llamadas acumulada acumulada
telefónicas porcentual
1 3-5 5 5 7.143%
2 6-8 17 22 31.43%
3 9-11 22 44 62.86%
4 12-14 18 62 88.57%
5 15-17 6 68 97.14%
6 18-20 2 70 100%
Total 70

Calculo de Q1, Q2 y Q3
Los cuantiles se calculan con la fórmula

Ci = LRi + i

Se localiza al cuartil 1 en la clase 2 que contiene el 25% de las observaciones

Q1 = 5.5+ 3 = 5.5 + 3(0.7353) = 5.5 + 2.2059 = 7.7059


El cuartil 2 o mediana se ubica en la clase 3 que contiene el 50% de los
datos:

Q2 = 8.5+ 3 = 8.5 + 3(0.5909) = 8.5 + 1.7727 = 10.2727

El cuartil 3 se localiza en la clase 4 que contiene el 75% de las observaciones

Q3 = 11.5+ 3 = 11.5 + 3(0.4722) = 11.5 + 1.4167 = 12.9166

b) Calculo del D3 se ubica en la clase 2 que contiene el 30% de la


población

D3 = 5.5 + 3 = 5.5 + 3(0.9412) = 5.5 + 2.8235 = 8.3235

40
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

c) Calculo del P93 se encuentra en la clase 5 que contiene el 93% de las


observaciones

P93 = 14.5 + 3 = 14.5 + 3(0.5167) = 14.5 + 1.55 = 16.05

d) Calculo del Rango medio y eje medio

Rango Medio = =

Eje medio = =

2.1.5.-Representación gráfica de las medias de tendencia central y posición

Diagrama caja-bigote.
El diagrama caja-bigote, también llamado de líneas y bloques, es una
representación gráfica que ayuda a ilustrar un conjunto de datos. Para
elaborar el diagrama se necesitan 5 valores estadísticos:
xmenor = valor mínimo
Q1 = Cuartil 1
= mediana
Q3= Cuartil 3
xmayor = valor máximo

EJEMPLO

Con los valores que se obtuvieron en el ejemplo anterior: de la empresa que


realizó el conteo de las llamadas telefónicas de sus 70 empleados en una
semana. Hacer el diagrama caja bigote.

xmenor = 3
Q1 = 7.7059
= 10.2727
Q3= 12.9166

41
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

xmayor = 20

Solución:
Para elaborar el diagrama caja-bigote, primero se establece una escala
adecuada en el eje horizontal. Después se dibuja un rectángulo que es la
caja, que parte de Q1 (7.7059 llamadas) y termina en Q3 (12.9166 llamadas).
Dentro de la caja se marca un segmento vertical que representa la mediana
(10.2727). Después se trazan dos líneas horizontales, una desde la caja hasta
el valor mínimo (3) y otra hasta el valor máximo (20).

= 10.2727

Q1 = 7.7059 Q3= 12.9166


xmenor = 3 xmayor = 20

0 22

42
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

2.2 Medidas de dispersión y forma

Ya que se localizó el centro de la distribución de un conjunto de datos, el


siguiente paso es encontrar las medias de dispersión o variabilidad de los
mismos. Al grado en que los datos numéricos tienden a extenderse
alrededor de un valor medio se le llama variación o dispersión de los datos.
Existen distintas medidas de variabilidad, las que se describen en esta
sección son: rango, rango intercuartílico, rango entre percentiles, desviación
media, varianza, desviación estándar y coeficiente de variación. Y las
medidas de forma son: coeficiente de asimetría y curtosis.

2.2.1 Rango, rango intercuartílico, rango interpercentílico.

Rango.-Esta medida de dispersión es llamada también recorrido o amplitud


de variación y se define como la diferencia entre el valor más grande y más
pequeño de un conjunto de datos.

Rango = valor mayor – valor menor

Ejemplo: Determinar el rango de las siguientes temperaturas en °C


registradas en 8 días consecutivos en la Ciudad de México

25.3 28 29.7 30.5 30.8 18.6 22.3 25.5


Solución:

Valor mayor = 30.8°C


Valor menor = 18.6°C

Rango = 30.8°C -18.6°C = 12.2°C

El resultado indica que las temperaturas extremas registradas difieren en


12.2°C

Rango intercuartílico para datos no agrupados y agrupados.- También


llamada amplitud cuartílica o intercuartílica: es la distancia entre el primer
cuartil y el tercero.

Rango intercuartílico= Q3 – Q1 (50% de la población)

EJEMPLO

Calcular el rango intercuartílico de la empresa que realizó el conteo de las


llamadas telefónicas de sus 70 empleados en una semana obteniéndose los
siguientes valores Q1 = 7.7059 y Q3= 12.9166

43
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Rango intercuartílico= Q3 – Q1= 12.9166- 7.7059 = 5.21 es la amplitud


intercuartílica que contiene el 50% de la población

Rango interpercentílico para datos agrupados y sin agrupar.- es el recorrido


de la variable entre el percetil 90 y percentil 10

Rango interpercentílico = P90 – P10 (80% de la población)

EJEMPLO

Calcular el rango interpercentílico de tiempo en minutos que se tardan en


llegar 9 alumnos de su casa a la clase de tenis en el Deportivo “Plan
Sexenal”:
5, 10, 15, 15, 20, 20, 25, 30, 35

Calcular el rango interpercentílico.

Solución:

Rango interpercentílico = P90 – P10

Calculo del percentil 10 (P10)


Localización del percentil 10
L10 = (9 + 1) (10/100)= 1
Se ubica en el lugar 1 y su valor es

P10= 5

Calculo del percentil 90 (P90)


Localización del percentil 90
L90 = (9 + 1) (90/100)= 9
Se ubica en el lugar 9 y su valor es

P90= 35
Rango interpercentílico = P90 – P10 = 35 – 5 = 30

2.2.2 Desviación media, varianza y desviación estándar

Desviación Media.- La desviación media de un conjunto de números es la


desviación promedio de valores con respecto a la media del grupo, sin tomar
en cuenta el signo de la diferencia. Es el promedio de alejamiento con
respecto a la media, valor arriba o abajo del valor central.

44
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

La desviación media para datos no agrupados una muestra, indicada por DM


es:

Desviación media para datos no agrupados de una muestra:

DM =

Donde:

xi= valor de cada observación


= media aritmética de los valores
n = numero de observaciones de la muestra
= indica el valor absoluto

EJEMPLO

Número de pacientes atendidos en una semana en un consultorio de


ortopedia del hospital Español.

35 46 49 53 59 68 40

Determine e interprete la desviación media.

Solución:
𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙|
𝒙𝒊

35 35-50= -15 15
46 46-50= -4 4
49 49-50= -1 1
53 53-50= 3 3
59 59-50= 9 9
68 68-50= 18 18
40 40-50= -10 10
Total ∑|𝒙𝒊 − 𝒙| =60

45
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Calculo de la media aritmética

= (35+46+49+53+59+68+40) / 7 =350 / 7 = 50

Desviación media para datos no agrupados de una muestra:

∑|𝒙𝒊 𝒙|
DM =
𝒏

∑|𝒙𝒊 𝒙| 𝟔𝟎
DM = = = 8.57
𝒏 𝟕

La desviación media es 8.57 pacientes por día. El número de pacientes varía,


en promedio, en 8.57 pacientes por día con respecto a la media de 50
lesionados diarios.

Desviación media para datos agrupados de una muestra:

∑𝒇𝒊 |𝒙𝒊 𝒙|
DM =
𝒏

Donde:

xi = marca de clase
𝒇𝒊 = frecuencia de cada clase
𝒙 = media aritmética de los valores
n = numero de observaciones de la muestra
= indica el valor absoluto

EJEMPLO

Una muestra de cantidades pagadas por ingresar un auto a un


estacionamiento público un domingo al centro histórico de la ciudad de
México, se presenta en la siguiente distribución de frecuencias:

46
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Cantidad pagada Frecuencia


(pesos)
0 – 25 10
25 – 50 20
50 – 75 40
75 – 100 30
100 – 125 20
Total 120

Determine e interprete la desviación media.

Solución:

Cantidad pagada Frecuencia 𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙| 𝒇𝒊 |𝒙𝒊 − 𝒙|


(pesos)
0 – 25 10 12.5 125 - 56.25 56.25 562.5
25 – 50 20 37.5 750 - 31.25 31.25 625
50 – 75 40 62.5 2500 - 6.25 6.25 250
75 – 100 30 87.5 2625 18.75 18.75 562.5
100 – 125 20 112.5 2250 43.75 43.75 875
Total 120 8250 2875
Calculo de la media aritmética

𝟖𝟐𝟓𝟎
𝒙=
= 𝟔𝟖. 𝟕𝟓
𝟏𝟐𝟎
La desviación media para datos agrupados de una muestra es:

∑𝒇𝒊 |𝒙𝒊 𝒙| 𝟐𝟖𝟕𝟓


DM = = = 𝟐𝟑. 𝟗𝟔
𝒏 𝟏𝟐𝟎

La desviación media de 23.96 pesos, quiere decir que el costo promedio del
estacionamiento de 23.96 pesos varía con respecto a la media de 68.75
pesos diarios.

Varianza.- Se define como la media aritmética de las desviaciones


cuadráticas con respecto a la media.
La varianza es difícil de interpretar, ya que las unidades están al cuadrado,
por lo que al obtener la raíz cuadrada obtenemos la desviación estándar que
tiene la misma unidad de medición que se utiliza en los datos originales.
47
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Datos no agrupados.

Varianza poblacional

Donde:

= varianza de la población
=media de la población
=valor de cada observación
N= tamaño de la población

Varianza muestral
∑(𝒙𝒊 − 𝒙)𝟐
𝟐
𝒔 =
𝒏−𝟏

donde:

s2 = varianza de la muestra
= media de la muestra
=valor de cada observación
n = tamaño de la muestra

Datos agrupados.

Varianza poblacional

=frecuencia de la clase i
=punto medio de la clase i (marca de clase)
=media de la población
N= tamaño de la población

Varianza muestral
𝟐
∑ 𝒇𝒊 (𝒙𝒊 − 𝒙)𝟐
𝒔 =
𝒏−𝟏
48
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

=frecuencia de la clase i
=punto medio de la clase i (marca de clase)
= media de la muestra
n = tamaño de la muestra

Desviación estándar.- Es la raíz cuadrada positiva de la varianza y se


presenta en las mismas unidades que los datos.

Datos no agrupados.

Desviación estándar poblacional ( )

Desviación estándar muestral (s)

Datos agrupados

Desviación estándar poblacional ( )

Desviación estándar muestral (s)

49
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Fórmulas directas:

Datos no agrupados
Varianza muestral:

Desviación estándar muestral:

Datos agrupados.
Varianza muestral:

Desviación estándar muestral:

EJEMPLO

Costos en dólares hora-hombre de una muestra de 5 empleados de una


compañía de Ingeniería son 5, 7, 10, 15 y 23. Obtenga la varianza y la
desviación estándar.

Solución:

Costos
hora-hombre

5 5-12=-7 49
7 7-12=-5 25
10 10-12=-2 4
15 15-12=3 9
23 23-12=11 121
0 (𝐱𝐢 − 𝐱)𝟐 = 𝟐𝟎𝟖

50
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Varianza:

∑(𝒙𝒊 − 𝒙)𝟐 𝟐𝟎𝟖


𝒔𝟐 = = = 𝟓𝟐. 𝟎 (𝒅ó𝒍𝒂𝒓𝒆𝒔 𝒂𝒍 𝒄𝒖𝒂𝒅𝒓𝒂𝒅𝒐)
𝒏−𝟏 𝟓−𝟏

Desviación estándar:

∑(𝒙𝒊 − 𝒙)𝟐 𝟐𝟎𝟖


𝒔= = = √𝟓𝟐 = 𝟕. 𝟐𝟏
𝒏−𝟏 𝟓−𝟏

EJEMPLO

En una prueba de tiro al blanco de 5 anillos, 2 competidores. Ortiz y Pineda,


obtuvieron los siguientes resultados. Obtener la varianza y la desviación
estándar. ¿Decir quién es mejor tirador?

0
1
2
3
5 4

51
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Ortiz Pineda
Puntos Frecuencia Puntos Frecuencia
Xi fi Xi fi
5 1 5 4
4 8 4 9
3 14 3 7
2 5 2 5
1 1 1 3
0 1 0 2
Total 30 Total 30

Solución:
Se calcula la varianza y la desviación estándar con las fórmulas de varianza
( ) y desviación estándar poblacional ( ) para datos agrupados
considerando como el valor de cada observación y no como la marca de
clase.

Cálculo de la varianza y la desviación estándar de Ortiz:

Frecuencia (𝒙𝒊 − 𝝁) (𝒙𝒊 − 𝝁)𝟐


Puntos

5 1 5 2 4 4
4 8 32 1 1 8
3 14 42 0 0 0
2 5 10 -1 1 5
1 1 1 -2 4 4
0 1 0 -3 9 9
Total 30

52
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Primero se obtiene la media:

Varianza

Desviación estándar

Cálculo de la varianza y la desviación estándar de Pineda:

Puntos Frecuencia (𝒙𝒊 − 𝝁) (𝒙𝒊 − 𝝁)𝟐 𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐

5 4 20 2 4 16
4 9 36 1 1 9
3 7 21 0 0 0
2 5 10 -1 1 5
1 3 3 -2 4 12
0 2 0 -3 9 18
Total 30

Obtención de la media:

Varianza

Desviación estándar

53
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Ortiz es mejor tirador, ya que tiene menos dispersión en sus tiros, aunque
tenga el mismo promedio que Pineda.

EJEMPLO

Una muestra de las cantidades(en miles de pesos) que los empleados de


Nacional Financiera ahorran mensualmente, se muestra a continuación.
Calcular la varianza y la desviación estándar.

Cantidad Número de
Ahorrada empleados
(miles de pesos)
1-3 2
3-5 6
5-7 13
7-9 6
9-11 3
Total 30

Solución: Se utilizan las fórmulas abreviadas para calcular la varianza y la


desviación estándar para datos agrupados de una muestra, apoyándose en
la siguiente tabla:

Cantidad Número de
Ahorrada Empleados (marca
(miles de de
pesos) clase)
1-3 2 2 4 2x4=8
3-5 6 4 24 4x24=96
5-7 13 6 78 6x78=468
7-9 6 8 48 8x48=384
9-11 3 10 30 10x30=300
Total 30 =184 =1256

Varianza muestral:

= =4.395
Desviación estándar muestral:

54
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

= = 2.096

La desviación estándar muestral es $2096. La varianza muestral es 4 395


pesos al cuadrado.

2.2.3 Regla empírica.- La regla empírica se aplica solamente a distribución de


frecuencias simétricas en forma de campana, en donde aproximadamente el
68.26% de las observaciones hallarán entre más una menos una desviación
estándar (𝝈) desde la media; casi el 95.44% de las observaciones se
encontrarán en más dos y menos dos desviaciones estándar desde la media;
prácticamente todas las observaciones (99.74%) estarán entre más tres y
menos tres desviaciones estándar, a partir del valor medio. Ver siguientes
figuras.

55
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

EJEMPLO

Una muestra de las cuentas por concepto de energía eléctrica en un edificio


de departamentos de la “Unidad Habitacional Sotelo” para el mes de mayo,
sigue una distribución de frecuencias simétricas en forma de campana
(distribución normal). La media muestral de los consumos es de $8 300, con
una desviación estándar de $2 300. Usando la regla empírica obtenga:
a) Aproximadamente, ¿entre que cantidades está el 68% de las cuentas
de consumo de energía eléctrica?
b) Aproximadamente, ¿entre que cantidades se halla el 95% de los
gastos por energía eléctrica?
c) Aproximadamente, ¿entre que valores queda el 100% de los costos
por energía eléctrica?

Solución:
a) Aproximadamente el 68% de las cuentas de consumo de energía
eléctrica están entre $6000 y $10 600, que se obtienen por:

𝝁 ± 𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟐𝟑𝟎𝟎

56
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

b) Aproximadamente el 95% de los gastos de consumo de eléctrica se


hallan entre $3700 y $12900, que se obtienen por:

𝝁 ± 𝟐𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟐(𝟐𝟑𝟎𝟎)

c) Aproximadamente el 100% de los costos por energía eléctrica se


encuentran entre $1400 y %15200, que se calcula como sigue:

𝝁 ± 𝟑𝝈 = 𝟖𝟑𝟎𝟎 ± 𝟑(𝟐𝟑𝟎𝟎)

2.2.4 Coeficiente de variación.


Para comparar las dispersiones de dos o más distribuciones se utiliza el
coeficiente de variación (CV) el cual nos indica la magnitud relativa de la
desviación estándar con respecto a la media de la distribución. Es
adimensional y se expresa en porcentaje:

Coeficiente de variación CV para una muestra:


𝒔
𝑪𝑽 = (𝟏𝟎𝟎)
𝒙

57
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Coeficiente de variación CV para una población:



𝑪𝑽 = (𝟏𝟎𝟎)
µ
Donde:

s = desviación estándar muestral


 = desviación estándar poblacional
𝒙 = media muestral
µ = media poblacional
EJEMPLO

Se va a comparar la variación en los ingresos mensuales de varios


egresados de la carrera de Administración de Empresas y de
Ingeniería Civil. En una muestra de Administradores, la media de
ingresos es $15 000 y la desviación estándar $1 500. Para la muestra
de ingenieros, la media de ingresos es $20 000 y la desviación
estándar $3 000. Compare las dispersiones relativas de las dos
distribuciones empleando el coeficiente de variación.

Solución:
Para los administradores:
𝒔
𝑪𝑽 = (𝟏𝟎𝟎)
𝒙
𝟏𝟓𝟎𝟎
𝑪𝑽 = 𝟏𝟓𝟎𝟎𝟎
(𝟏𝟎𝟎) = 10%

Para los ingenieros:


𝒔
𝑪𝑽 = (𝟏𝟎𝟎)
𝒙
𝟑𝟎𝟎𝟎
𝑪𝑽 = (𝟏𝟎𝟎) = 15%
𝟐𝟎𝟎𝟎𝟎

Existe más dispersión relativa con respecto a la media en la


distribución de ingresos mensuales de los ingenieros (15%) en comparación
con la de los administradores (10%).

58
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

2.2.5 Coeficiente de asimetría y curtosis.

ASIMETRÍA.
Cuando una curva de distribución de frecuencias es simétrica se le llama
normal o campana de Gauss y se presenta siempre cuando la media
mediana y moda son iguales.

Si una curva de distribución de frecuencias no es simétrica se dice que es


asimétrica o sesgada

Una distribución sesgada es la dispersión de las observaciones con


respecto a la media, a la mediana o a la moda. Puede ser positivo (a la
izquierda) o negativo (a la derecha).

Las medidas de dispersión y posición más importantes que hemos vistos


son la media y la desviación estándar, pertenecen a un grupo llamado
momentos:
 Momento de 1er. Orden (m1).- Con el momento de primer orden se
calcula la media

∑ 𝒇𝒊 𝒙𝒊
m 1 = media = 𝝁=
𝑵

 Momento de 2º orden (m2).- Con el momento de segundo orden se


calcula la varianza y obtenemos la desviación estándar

𝜮𝒇𝒊 (𝒙𝒊 𝝁)𝟐


m 2 = varianza = 𝝈𝟐 =
𝑵

 Momento de 3er. Orden (m3).- El momento de tercer orden nos sirve


para cuantificar y calificar el sesgo o el grado de asimetría.

𝜮𝒇𝒊 (𝒙𝒊 𝝁)𝟑


m3=
𝑵

 Momento de 4º orden (m4).- El momento de cuarto orden nos sirve


para cuantificar y calificar la curtosis (grado de apuntamiento de una
distribución de frecuencias)

𝜮𝒇𝒊 (𝒙𝒊 𝝁)𝟒


m4=
𝑵

59
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Coeficiente de Sesgo o grado de asimetría.

Coeficiente de Sesgo=

Donde:

𝑚 = momento de tercer orden


𝜎 = desviación estándar elevada a la tercera potencia

a) Si el coeficiente de sesgo es igual a cero no hay sesgo y es simétrica


la curva de frecuencias.

b) Si el coeficiente de sesgo es menor de cero, es negativo el sesgo.

c) Si el coeficiente de sesgo es mayor de cero, es positivo el sesgo

Simétrica
Coeficiente de sesgo = 0

60
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Sesgo negativo Sesgo positivo


Coeficiente de sesgo  0 Coeficiente de sesgo  0

También la fórmula empírica de Karl Pearson mide la desviación de la


simetría:

3(media  mediana)
Coeficiente de sesgo de Pearson =
desviación _ estándar

CURTOSIS.
La curtosis nos determina el grado de apuntamiento de una distribución
de frecuencias.
Las figuras siguientes nos muestran las formas de las distribuciones
normales. La curva (1) cuya característica es una concentración de
datos en el centro de distribución con poca dispersión, se le llama
distribución leptocúrtica. La curva (2) tiene la forma ideal de una curva
normal y se conoce como distribución mesocúrtica. La curva (3) es una
distribución muy heterogénea con mucha dispersión y es conocida como
platicúrtica.

61
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Coeficiente de curtosis.

Coeficiente de curtosis =

Donde:

𝑚 = momento de cuarto orden


𝜎 = desviación estándar elevada a la cuarta potencia

a) Si el coeficiente de curtosis es igual a 3 la distribución es


mesocúrtica.

b) Si el coeficiente de curtosis es menor a 3 la distribución es


aplanada o platicúrtica.

c) Si el coeficiente de curtosis es mayor de 3 es aguda o


leptocúrtica.

EJEMPLO

Encontrar el coeficiente de sesgo y curtosis (por momentos) del ejemplo


del tiro al blanco, considerando al competidor Ortiz.

Ortiz
Puntos Frecuencia
Xi fi
5 1
4 8
3 14
2 5
1 1
0 1
Total 30

62
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Solución:

Puntos Frecuencia 𝒇𝒊 𝒙𝒊 (𝒙𝒊 − 𝝁) (𝒙𝒊 − 𝝁)𝟐 𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐


𝒙𝒊 𝒇𝒊
5 1 5 (5-3)=2 4 4
4 8 32 (4-3)=1 1 8
3 14 42 (3-3)=0 0 0
2 5 10 (2-3)=-1 1 5
1 1 1 (1-3)=-2 4 4
0 1 0 (0-3)=-3 9 9
Total N = 30 𝒇𝒊 𝒙𝒊 𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐
= 𝟑𝟎
= 𝟗𝟎

(𝒙𝒊 − 𝝁)𝟑 𝒇𝒊 (𝒙𝒊 − 𝝁)𝟑 (𝒙𝒊 − 𝝁)𝟒 𝒇𝒊 (𝒙𝒊 − 𝝁)𝟒

8 8 16 16
1 8 1 8
0 0 0 0
-1 -5 1 5
-8 -8 16 16
-27 -27 81 81
Total 𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟑 = −𝟐𝟒 𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟒 = 𝟏𝟐𝟔

Primero se obtiene la media:

∑ 𝒇𝒊 𝒙𝒊 𝟗𝟎
𝝁= = =3
𝑵 𝟑𝟎

Varianza
𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐 𝟑𝟎
𝝈𝟐 = = =𝟏
𝑵 𝟑𝟎

Desviación estándar
𝚺𝒇𝒊 (𝒙𝒊 − 𝝁)𝟐 𝟑𝟎
𝝈= = = √𝟏 = 𝟏
𝑵 𝟑𝟎

63
Guía de Estudio de Estadística Descriptiva Ma. Adriana Morales García

Coeficiente de Sesgo

𝜮𝒇𝒊 (𝒙𝒊 𝝁)𝟑 𝟐𝟒


m3= = = −𝟎. 𝟖𝟎
𝑵 𝟑𝟎

𝒎𝟑 𝟎.𝟖𝟎
Coeficiente de Sesgo= = = −𝟎. 𝟖𝟎
𝝈𝟑 (𝟏)𝟑

Tenemos un sesgo negativo.

Coeficiente de curtosis

𝜮𝒇𝒊 (𝒙𝒊 𝝁)𝟒 𝟏𝟐𝟔


m4= = = 𝟒. 𝟐
𝑵 𝟑𝟎

.
Coeficiente de curtosis = = = 4.2
( )

Es una curva leptocúrtica porque el coeficiente de curtosis es mayor


que 3.

NOTA.- En el coeficiente de sesgo y curtosis para datos agrupados por


intervalos, xi es la marca de clase.

64

También podría gustarte