ESTADÍSTICA
INFERENCIAL
Dra. Norma Aida Valenzuela Sánchez
¿Qué es la estadística inferencial?
• Se llama estadística inferencial o inferencia estadística a la rama de la
Estadística encargada de hacer deducciones, es decir, inferir propiedades, conclusiones
y tendencias de la población, a partir de una muestra del conjunto.
• Su papel es interpretar, hacer proyecciones y comparaciones.
Muestra
Una población es el conjunto de
todos los elementos que interesan
en un estudio N.
Una muestra es una porción o
parte de la población de interés n.
• A las características numéricas de una población, como la media y la desviación estándar,
se les llama parámetros.
• A las características numéricas de una muestra, como la media y la desviación estándar,
se les llama Estimadores.
Razones para muestrear
1. Establecer contacto con toda la población requiere de mucho tiempo
2. El costo de estudiar todos los elementos resulta prohibitivo.
3. Resulta imposible verificar y localizar a todos los miembros de la
población.
4. Algunas pruebas son de naturaleza destructiva.
5. Los resultados de una muestra permiten calcular adecuadamente el valor
del parámetro poblacional.
PRUEBA DE
HIPÓTESIS
¿Qué es una prueba de hipótesis
estadística?
• En estadística, una hipótesis es una
HIPÓTESI afirmación sobre un parámetro de la
S población (como la media o desviación
estándar)
Una prueba de hipótesis es un procedimiento,
con el que se busca tomar una decisión sobre
el valor de verdad de una hipótesis estadística.
Prueba de
Al realizar una prueba de hipótesis decidimos
hipótesis si rechazar o no rechazar esa hipótesis
estadística.
Basamos la decisión en la evidencia muestral.
PRUEBA DE
HIPÓTESIS DE UNA
MUESTRA
Pasos de una prueba de hipótesis
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Establecer las Seleccionar Identificar Se formula Se toma una Interpretar el
hipótesis nula nivel de estadístico de regla de muestra y se resultado
y alternativa significancia prueba decisión decide
PASO 1: SE ESTABLECEN LA HIPÓTESIS NULA
(H0) Y ALTERNATIVA (H1)
Hipótesis Nula (H0): Hipótesis Alternativa
Enunciado relativo al valor
de un parámetro poblacional (H1):Enunciado que describe lo
con el fin de probar que se concluirá si se rechaza la
evidencia numérica. hipótesis nula
Hipótesis Alternativa
Hipótesis Nula
(H1): Es la hipótesis
(H0): Es la hipótesis
que niega a la hipótesis
de no cambio.
nula.
H0 : H1 : H1 : H1 :
H0 : H1 : H1 : H1 :
Las hipótesis son complementarias.
La nula tiene el símbolo de
igualdad siempre. Entonces en la
otra no puede aparecer el igual.
En la hipótesis alternativa se utiliza
o bien el símbolo de distinto ≠, o
bien mayor > o bien menor <
En términos generales
La hipótesis nula se formula para realizar una prueba: o se rechaza o no se rechaza
Es una afirmación que no se rechaza a menos que la información de la muestra
ofrezca evidencia convincente de que es falsa.
NOTA: El hecho de NO rechazar una hipótesis no prueba que H0 sea verdadera.
PASO 2: SELECCIONAR NIVEL DE
SIGNIFICANCIA
Nivel de significancia:
Probabilidad de rechazar la
hipótesis nula cuando es
verdadera (Nivel de riesgo)
• El investigador debe elegir el nivel de significancia antes de formular una regla de
decisión y recopilar datos.
ERROR TIPO I ERROR TIPO II
• Rechazar la hipótesis nula cuando es • No rechazar la hipótesis nula cuando es
verdadera. falsa.
PASO 3: IDENTIFICAR EL ESTADÍSTICO DE
PRUEBA
Estadístico de prueba:
Valor determinado a partir de la Se utilizarán los estadísticos de
información de la muestra, para
prueba Z y t
determinar si se rechaza la
hipótesis nula
Prueba de la media () cuando se
conoce Prueba de la media () cuando es
𝑥 −𝜇 𝑥 −𝜇
desconocida
𝑍= 𝑡=
𝜎 𝑠
√𝑛 √𝑛
PASO 4: SE FORMULA LA REGLA DE DECISIÓN
Regla de decisión: enunciado Valor crítico: Punto de división
sobre las condiciones específicas entre la región en que se rechaza la
en que se rechaza la hipótesis nula hipótesis nula y aquella en la que no se
y aquellas en las que no se rechaza
rechaza
Valor crítico se obtiene con el nivel de significancia
PRUEBAS DE
SIGNIFICANCIA
DE UNA O DOS
COLAS
PASO 5: SE TOMA UNA MUESTRA Y SE DECIDE
Se toma una muestra
Se calcula el estadístico de prueba
Se compara con el valor crítico
Se toma la decisión de rechazar o no la hipótesis nula.
PASO 6: INTERPRETAR RESULTADOS
EJEMPLO
• Un fabricante de galletitas produce paquetes en los cuales el peso nominal impreso es
de 500 gramos. Pero el contenido real es una variable aleatoria con distribución normal. No tienen
exactamente 500 gramos todos los paquetes. El fabricante, basándose en información histórica,
afirma que la media de esa variable X es μ=500 gramos con un desvío estándar de 5 gramos.
• Se desconfía de la afirmación del fabricante acerca de que μ=500 gramos.
• Se quiere analizar si en realidad el peso promedio de los paquetes es inferior a 500 gramos.
• Para esto se toma una muestra de tamaño 100, y se obtiene una media muestral de 497.3 gramos
• Realizar una prueba de hipótesis con un nivel de significación de 0.05
PASO 1: SE ESTABLECEN LA HIPÓTESIS NULA
(H0) Y ALTERNATIVA (H1)
Hipótesis Nula (H0): Hipótesis Alternativa (H1):
PASO 2: SELECCIONAR NIVEL DE SIGNIFICANCIA
𝜶=𝟎.𝟎𝟓
PASO 3: IDENTIFICAR EL ESTADÍSTICO DE
PRUEBA
• Basándonos en que X tiene una distribución normal y que conocemos σ=5, entonces es
posible afirmar que:
𝑥 −𝜇
𝑍=
𝜎
√𝑛
PASO 4: SE FORMULA LA REGLA DE DECISIÓN
Rechazaremos Ho El valor crítico
si Z< valor crítico < valor crítico para
Es -1.64
PASO 5: SE TOMA UNA MUESTRA Y SE DECIDE
Calcula el estadístico de
Muestra Se compara con el Decision
prueba
valor crítico=-1.64
n= 100 Z<-1.645 Se rechaza la
= -5.4 hipótesis
nula.
PASO 6. INTERPRETAR RESULTADOS
• Con un nivel de significación de 0.05 se rechaza la hipótesis nula, que afirma que la
media del peso de los paquetes de galletitas es de 500 , a favor de la hipótesis alternativa,
que afirma que la media del peso de los paquetes de galletitas es inferior a 500 gramos.
• Por lo tanto, habría que recalibrar la máquina que rellena los paquetes para que la media
sea de 500 gramos.
• Una compañía fabrica y arma escritorios y otros muebles para oficina
en diferentes plantas en el oeste del estado de Nueva York. La
producción semanal del escritorio modelo A en la planta de Fredonia
tiene una distribución normal, con una media de 200 y una desviación
estándar de 16. Hace poco, con motivo de la expansión del mercado,
se introdujeron nuevos métodos de producción y se contrató a más
empleados.
EJEMPLO 2 • El vicepresidente de fabricación pretende investigar si hubo algún
cambio en la producción semanal del escritorio modelo A. En otras
palabras, ¿la cantidad media de escritorios que se produjeron en la
planta de Fredonia es diferente de 200 escritorios semanales con un
nivel de significancia de 0.01?
• Para comprobarlo, se tomó una muestra de la producción de 50
semanas y el promedio de la producción fue de 203.5
PASO 1: SE ESTABLECEN LA HIPÓTESIS NULA
(H0) Y ALTERNATIVA (H1)
Hipótesis Nula (H0): Hipótesis Alternativa (H1):
PASO 2: SELECCIONAR NIVEL DE SIGNIFICANCIA
𝜶=𝟎.𝟎𝟏
PASO 3: IDENTIFICAR EL ESTADÍSTICO DE
PRUEBA
• Basándonos en que X tiene una distribución normal y que conocemos σ=16 , entonces es
posible afirmar que:
𝑥 −𝜇
𝑍=
𝜎
√𝑛
PASO 4: SE FORMULA LA REGLA DE DECISIÓN
Para una prueba de 2 colas, el Rechazaremos Ho
valor crítico de si
Es -2.58 y 2.58
-2.58 2.58
PASO 5: SE TOMA UNA MUESTRA Y SE DECIDE
Calcula el estadístico de
Muestra Se compara con el Decision
prueba
valor crítico
n= 50 -2.58<Z<2.58 No se rechaza
= 1.547 la hipótesis
nula.
PASO 6. INTERPRETAR RESULTADOS
• Con un nivel de significancia de 0.01 no se rechaza la hipótesis nula, así que no se
demuestra que la media población haya cambiado
• La información de la muestra no indica que los nuevos método de producción resultaron
en un cambio en el ritmo de producción de 200 escritorios a la semana.
EJEMPLOS CON
DESCONOCIDA
EJEMPLO 1
• La longitud media de una pequeña barra de contrapeso es de 43 milímetros. Al supervisor
de producción le preocupa que hayan cambiado los ajustes de la máquina de producción
de barras. Solicita una investigación al departamento de ingeniería, que selecciona una
muestra aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados
en milímetros.
¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de
significancia 0.02?
PASO 1: SE ESTABLECEN LA HIPÓTESIS NULA
(H0) Y ALTERNATIVA (H1)
Hipótesis Nula (H0): Hipótesis Alternativa (H1):
PASO 2: SELECCIONAR NIVEL DE SIGNIFICANCIA
𝜶=𝟎.𝟎𝟐
PASO 3: IDENTIFICAR EL ESTADÍSTICO DE
PRUEBA
• En este caso se utilizará la distribución t porque no se conoce la desviación estándar de la
población.
𝑥 −𝜇
𝑡=
𝑠
√𝑛
PASO 4: SE FORMULA LA REGLA DE DECISIÓN
Para una prueba de 2 colas, el valor crítico Rechazaremos Ho
de si 2.718
Es -2.718 y 2.718 2.718
Cómo obtenemos los valores críticos de t?
grados de libertad : gl
gl = n – 1
n= 12
Prueba de dos colas
PASO 5: SE TOMA UNA MUESTRA Y SE DECIDE
𝑡<−2.718
Calcula el estadístico de
Muestra prueba Se compara con el Decision
valor crítico
n= 12 se rechaza Ho
S=1.784
PASO 6. INTERPRETAR RESULTADOS
• Con un nivel de significancia de 0.02 se rechaza la hipótesis nula, se concluye que la
media poblacional no es de 43 milímetros.
• La máquina está fuera de control y necesita algunos ajustes.
EJEMPLO
• Sean las siguientes hipótesis:
• En el caso de una muestra aleatoria de 10 observaciones seleccionada de una población normal, la media
muestral fue de 12, y la desviación estándar de la muestra, de 3. Utilice el nivel de significancia 0.05:
a) Formule la regla de decisión.
b) Calcule el valor del estadístico de prueba.
c) ¿Cuál es su decisión respecto de la hipótesis nula?
a) Formule la regla de decisión.
• grados de libertad : gl
• gl = n – 1
• n= 10
• Prueba de una cola
• Valor crítico es 1.833
Regla de decisión
Rechazaremos Ho
si 1
1.833
b) Calcule el valor del estadístico de prueba.
=
c) ¿Cuál es su decisión respecto de la hipótesis nula?
Se rechaza Ho, y se concluye que la media
es mayor a 10
1.833
1
Valor p en la prueba de hipótesis
• El valor p (ó p-value)Es el nivel de significancia mas pequeño, a partir del cual la
hipótesis nula puede ser rechazada.
• Un valor muy pequeño, como p=0.0001 indica que existe poca posibilidad que Ho sea
verdadera; por otra parte una valor p de 0.2033 indica de Ho no se rechaza y que existe
poca probabilidad que se rechace.
¿Cómo se calcula el valor p?
• Se utiliza el valor del estadístico Z calculado y se busca en la tabla de valores z. y
verificar cuánto nos deja de probabilidad a la izquierda o derecha, según sea el caso, este
estadístico.
• Si
• p valor es muy útil cuando se trabaja con software.
EJEMPLO:
Prueba de 2 colas, Si
= 1.55
Se busca en la tabla la probabilidad de encontrar un valor z de 1.55 o
más. y se encuentra que p =0.50- 0.4394= 0.0606
p=0.06 entonces para 2 colas p=0.12 > =0.01
PRUEBA DE
HIPÓTESIS PARA
UNA PROPORCIÓN
Pasos de una prueba de hipótesis
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Establecer las Seleccionar Identificar Se formula Se toma una Interpretar el
hipótesis nula nivel de estadístico de regla de muestra y se resultado
y alternativa significancia prueba decisión decide
PROPORCIÓN: Fracción, razón o porcentaje que indica la parte de
la muestra de la población que posee un rasgo de interés particular.
Si representa la proporción de la muestra, x el
número de éxitos y n el número de elementos de • Ejemplo de una proporción. Una encuesta reciente indicó
la muestra, se determina una proporción muestral que 92 de cada 100 entrevistados estaban de acuerdo con el
de la siguiente manera: horario de verano para ahorrar energía. La proporción de la
muestra es de 92/100, o 0.92, o 92%.
Si estamos interesados en formular una prueba de hipótesis respecto de la
proporción de la población (p).
El estadístico de contraste que usamos en una Prueba de hipótesis para una
proporción es:
Donde
: proporción propuesta (proporción poblacional hipotética)
Procederemos de forma análoga al caso de los ejemplos anteriores cuando tratábamos casos de medias para decidir
si hay evidencia suficiente para rechazar o no la hipótesis nula.
EJEMPLO
• En una encuesta realizada a 871 adultos, el 53 % de los
entrevistados estuvieron a favor de un apoyo decidido al
Gobierno. Con una confianza del 95% por ciento, ¿ se
podría asegurar que la mayoría de los adultos de dicha
ciudad está a favor de un apoyo decidido al Gobierno ?
1.645
•
Prueba de cola derecha,
Valor crítico: 1.645
Se rechaza Ho si Z estadístico>1.645
Entonces, con un nivel de confianza del 95%, hay
= =1.77 evidencia suficiente para rechazar la hipótesis nula. Es
decir, hay evidencia a favor de un apoyo decidido al
gobierno.
. prtesti 871 .53 .50
One-sample test of proportion x: Number of obs = 871
Mean Std. Err. [95% Conf. Interval]
x .53 .0169113 .4968544 .5631456
p = proportion(x) z = 1.7708
Ho: p = 0.5
Ha: p < 0.5 Ha: p != 0.5 Ha: p > 0.5
Pr(Z < z) = 0.9617 Pr(|Z| > |z|) = 0.0766 Pr(Z > z) = 0.0383
Ejercicio 2
• Un restaurante asegura que el 90 % de sus órdenes entrega en menos de 10 minutos. En
una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. ¿Puede concluirse con
el nivel de significancia de 0. 01, que menos del 90 % de las órdenes se entregan en
menos de 10 minutos?
Prueba de cola izquierda
•
Valor crítico: 2.326
Se rechaza Ho si Z estadístico< - 2.326
^ 82 =0.82
𝑃=
100
=-2.667 Se rechaza Ho, . Esto quiere decir, que menos
del 90% de los clientes reciben sus pedidos en
menos de 10 minutos
PRUEBAS DE HIPÓTESIS
DE DOS MUESTRAS
INDEPENDIENTES
PRUEBAS DE HIPÓTESIS DE DOS MUESTRAS
INDEPENDIENTES
SUPUESTOS
• Las dos poblaciones siguen distribuciones normales
• Las dos muestras son independientes
• Las hipótesis se pueden plantear
•
ESTADÍSTICO
conocida desconocida
𝑥1 − 𝑥2
𝑍=
√
2 2
𝜎 1 𝜎 2
+
𝑛1 𝑛2
EJEMPLO
• La compañía gerber desea comparar el aumento de peso de bebés que consumen sus
productos en comparación con los que emplean producto de su competidor. Una muestra de
40 bebés que consumen los productos gerber reveló un aumento de peso medio de 7.6 libras
en sus primeros 3 meses de vida , con una desviación estándar de la población de la muestra
de 2.3 libras. una muestra de 55 bebés que consumen la marca de competidor reveló un
aumento medio de 8.1 libras con una desviación estándar de la población de 2.9 libras, con
el nivel de significancia de 0.05 ¿es posible concluir que los bebés que consumieron la
marca Gerber ganaron menos peso?
PASO 1
𝐻 0 :𝜇𝐺 ≥𝜇𝐶 : Peso promedio niños gerber
: Peso promedio niños competencia
• PASO 2. NIVEL DE SIGNIFICANCIA 0.05
• PASO 3. IDENTIFICAR ESTADÍSTICO DE PRUEBA
desv. estandar de población conocida
PASO 4. FORMULAR REGLA DE DECISIÓN
• con nivel de significancia 0.05, valor crítico -1.645
• Se rechaza Ho si estadístico Z <-1.645
PASO 5. TOMAR MUESTRA, CALCULAR ESTADÍSTICO Z Y DECIDIR
NO SE RECHAZA Ho
PASO 6. INTERPRETAR
• Los bebés que usaron marca gerber no ganaron menos peso.
EJEMPLO 2:
• Un investigador hizo un estudio para saber si el salario medio de las enfermeras era
superior al de los maestros de escuela. Para esta investigación recopiló la información
siguientes sobre las cantidades que ganó la semana pasada una muestra de maestros y
enfermeras.
• ¿Es razonable concluir que el salario semanal medio de las enfermeras es mayor? Utilice
nivel de significancia 0.01
MAESTROS 845 826 827 875 784 809 802 820 829 830 842 832
ENFERMERA
S
841 890 821 771 850 859 825 829
Paso 1
𝐻 0 :𝜇𝐸 ≤𝜇𝑀 : Salario promedio enfermeras
: Salario promedio maestros
• PASO 2. NIVEL DE SIGNIFICANCIA 0.01
• PASO 3. IDENTIFICAR ESTADÍSTICO DE PRUEBA
desv. estandar de población desconocida
PASO 4. FORMULAR REGLA DE DECISIÓN
• Prueba de cola derecha con nivel de significancia 0.01,
• gl= 8 + 12 – 2 =18
• valor crítico de 2.552
• Se rechaza Ho si estadístico t >2.552
PASO 5. TOMAR MUESTRA, CALCULAR ESTADÍSTICO Z Y DECIDIR
= 826. 8 =
=521.7
=
NO SE RECHAZA Ho
PASO 6. INTERPRETAR
• Con un nivel de significancia del 1% se puede decir que las enfermeras no ganan mas que
los maestros.
. ttest enfermeras == maestros, unpaired level(99)
Two-sample t test with equal variances
Variable Obs Mean Std. Err. Std. Dev. [99% Conf. Interval]
enferm~s 8 835.75 12.16369 34.40411 793.1834 878.3166
maestros 12 826.75 6.593299 22.83986 806.2725 847.2275
combined 20 830.35 6.158552 27.54188 812.7308 847.9692
diff 9 12.74017 -27.67182 45.67182
diff = mean(enfermeras) - mean(maestros) t = 0.7064
Ho: diff = 0 degrees of freedom = 18
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.7555 Pr(|T| > |t|) = 0.4890 Pr(T > t) = 0.2445