[go: up one dir, main page]

0% encontró este documento útil (0 votos)
84 vistas21 páginas

Prueba de Hipótesis Estadística (Ugto-2019)

Este documento introduce el concepto de prueba de hipótesis estadística y lo ilustra con un ejemplo. Explica que una prueba de hipótesis implica tomar una decisión sobre si rechazar o no una hipótesis estadística inicial basándose en evidencia muestral. Usa el ejemplo de un fabricante que afirma que los paquetes de galletas pesan 500 gramos, y se toma una muestra para decidir si rechazar esta afirmación. También define conceptos clave como variable, parámetro, estimador, hipó

Cargado por

JUAN MARTIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
84 vistas21 páginas

Prueba de Hipótesis Estadística (Ugto-2019)

Este documento introduce el concepto de prueba de hipótesis estadística y lo ilustra con un ejemplo. Explica que una prueba de hipótesis implica tomar una decisión sobre si rechazar o no una hipótesis estadística inicial basándose en evidencia muestral. Usa el ejemplo de un fabricante que afirma que los paquetes de galletas pesan 500 gramos, y se toma una muestra para decidir si rechazar esta afirmación. También define conceptos clave como variable, parámetro, estimador, hipó

Cargado por

JUAN MARTIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 21

OCTUBRE 12-2019

Prueba de Hipótesis Estadística (toma de decisión).


Introducción: ¿qué es una prueba de hipótesis estadística?

Imagina que un amigo, tuyo afirma que en cada partido


de fútbol que juega, mete tres o cuatro goles.
Impresionados con su excelente desempeño, vamos a
verlo jugar cinco partidos seguidos.

Pero ocurre que en esos cinco partidos no mete ningún


gol. ¿No pensaríamos que tal vez nos mintió? ¿No
es muy incompatible «lo observado» con su
afirmación inicial de que mete tres o cuatro goles
por partido? Este mini-ejemplo te muestra la lógica que
hay detrás de una prueba de hipótesis estadística.

Por tanto; Una prueba de hipótesis es un


procedimiento, con el que se busca tomar una
decisión sobre el valor de verdad de una hipótesis
estadística (para poder tomar una decisión o
postulación al respecto, en base al ejemplo
anterior).

Al realizar una prueba de hipótesis decidimos si


rechazar o no rechazar esa hipótesis estadística.
Basamos la decisión en la evidencia muestral.
Un esquema muy simplificado que resume el proceso
sería el siguiente:

Por eso muchas veces se compara un proceso de


prueba de hipótesis con un juicio: hay que recoger
evidencias para analizar si la hipótesis de base (la
inocencia del acusado en el caso del juicio) se
sostiene o se rechaza.

Ejemplo intuitivo (sin detalles «técnicos»)


Comprender entonces muy bien que es una prueba de
hipótesis implica entender e interpretar varios
conceptos como son:(variable, parámetro, hipótesis
estadística, estadístico de prueba, n.s., desviación
estándar, asi como hacer interpretación de algunas
tablas estadísticas, etc).

Y también las relaciones entre ellos. Pero la idea


general de que es una prueba de hipótesis no es difícil
de entender. De hecho, es muy intuitiva. Veamos un
ejemplo que en forma natural expresa el razonamiento
y procedimiento detrás de una prueba de hipótesis.
Ejemplo. -Un fabricante de galletas produce paquetes
en los cuales el peso nominal impreso es
de 500 gramos. Pero el contenido real en gramos es
una variable aleatoria. No tienen
exactamente 500 gramos (todos los paquetes).
El fabricante, basándose en información histórica,
afirma que la media de esa variable X es μ=500 gramos
(μ = la población de paquetes), con un desvío estándar
de 5 gramos. Se desconfía de la afirmación del
fabricante acerca de que μ=500 gramos. Se quiere
analizar si en realidad el peso promedio de los paquetes
es inferior a 500 gramos.
La variable
La variable que nos interesa observar es X: peso en
gramos de un paquete de galletitas de la fábrica.

Las hipótesis en juego


Las dos afirmaciones (planteamiento) que se
contraponen en esta situación son:

 La afirmación del fabricante, que llamaremos


hipótesis nula (Ho): la media de X es 500:μ=500
 Afirmación alternativa (H1): Hipótesis alternativa: la
media de X es menor que 500: μ<500
No podemos conocer el verdadero valor del
parámetro, pero podemos estimarlo
Cómo se trata de una discusión acerca del valor de un
parámetro, no es fácil decidir cuál afirmación es
correcta. Habría que medir todos los paquetes de la
producción para conocer el valor promedio o sea X.

En general esto es inviable. Para no tener que medir el


peso en todos los paquetes de la producción se puede
tomar una muestra aleatoria de n paquetes, y analizar
si los valores observados de X son o no coherentes con
la afirmación del fabricante.
Para ello es requisito conocer sobre la distribución de la
variable media muestral (distribución normal).

Supongamos que se toma una muestra aleatoria de


100 paquetes, y se mide el peso (utilizando una
balanza muy precisa) en cada uno de
los 100 paquetes. Obtenemos entonces una muestra
aleatoria de la variable (promedio muestral) = X: es
decir; (X1,X2,X3,X4…,X100)
Sabemos que la media muestral X es un buen
estimador de la media poblacional μ. Entonces vamos a
calcular la media muestral del peso de los 100 paquetes
 Si obtenemos un valor de X «muy inferior a 500», es
decir una diferencia x–μ «muy grande»,
rechazaremos la hipótesis nula.
 Si obtenemos un valor de X «muy cercano a 500»,
es decir una diferencia x–μ «pequeña», diremos
que no existe evidencia suficiente para rechazar la
hipótesis nula.
La conclusión a la que llegaríamos (realizando el
proceso matemático), en los siguientes casos:

Caso A de evidencia muestral: se obtiene una media muestral muy


contraría a la afirmación inicial

Si se obtiene que el promedio de los pesos es


de x=421.3 gramos, podríamos concluir que la
evidencia muestral no es compatible con la afirmación
del fabricante. Se obtuvo un valor muy por debajo de
500 gramos. Podríamos rechazar la afirmación del
fabricante.
No puede ser cierto que E(X)=500, pero que se
observe x=421.3. Cómo x=421.3 de hecho se observó,
entonces rechazamos la hipótesis nula.

Caso B de evidencia muestral: se obtiene una media muestral «cercana» a


la afirmación inicial

Si se obtiene que el promedio de los pesos es


de x=499.80 gramos, podríamos pensar que el valor
de X obtenido es muy cercano al valor de μ propuesto
por la hipótesis inicial… y entonces concluir que no hay
evidencia contraria a esa hipótesis.
Caso C de evidencia muestral: se obtiene una media muestral que no es
concluyente «a simple vista» respecto de la afirmación inicial

Si se obtiene que el promedio de los pesos de 100


paquetes es de x=497.3 gramos… ¿Qué concluimos?
¿Es coherente con una media poblacional de 500 o no?
Este caso no pone en un dilema y no permite decidir
tan fácilmente.
Se presenta el problema de decidir que es «cerca» y
que es «lejos» de 500. Más adelante vamos a ver
cómo se decide un punto de corte o punto crítico que
permite definir una zona «cercana» (zona de no
rechazo) y una zona «lejana» (zona de rechazo).
Definición intuitiva

Entonces una prueba de hipótesis es un proceso en el


que, partiendo de dos hipótesis estadísticas
contrapuestas (una nula y una alternativa), tomamos
información muestral para decidir si se rechaza o no
la hipótesis inicial en favor de la hipótesis
alternativa, (tomar la mejor alternativa)

Problema del abordaje intuitivo que acabamos de hacer

El problema que tiene este abordaje es que no queda


bien definido que sería que X esté «cerca» o «lejos» de
500 gramos.
Para el caso A y B elegimos valores que «a ojo»
parecen muy por debajo (421.3) o muy cercanos (499.8)
a 500. Pero tenemos que poder tener un criterio objetivo
con el que tomar la decisión sobre si la evidencia
muestral es contraría o no a la afirmación inicial.
A continuación, nos vamos a meter con esta
complicación técnica. Pero la idea básica de que es una
prueba de hipótesis, es la que comentamos en este
ejemplo.
Para resolver el problema técnico, va a ser necesario
tener bien claros los siguientes conceptos.

Definiciones de conceptos fundamentales

Para entender bien que es una prueba de hipótesis


hay que tener bien claros (entre otros) los conceptos
de: variable, parámetro, estimador de un parámetro,
hipótesis estadística y estadístico de prueba.

¿Qué es una variable?

Una variable es una característica de interés, que


tienen los individuos de una población.

 Ejemplo 1: el peso de un paquete de galletitas


 Ejemplo 2: la cantidad de alumnos de una escuela
de CABA
 Ejemplo 3: la localidad en la que está ubicada un
comercio de una cierta cadena
¿Qué es un parámetro?

En estadística, un parámetro es una constante asociada


a la distribución de probabilidades de una variable
aleatoria.
 Ejemplo 1: Si una variable tiene distribución
binomial, sus parámetros son (n y p).
 Ejemplo 2: Si una variable tiene distribución
normal, sus parámetros son (μ y σ).
 Ejemplo 3: Si una variable tiene distribución
Bernoulli, su único parámetro es la probabilidad de
éxito (p).
¿Qué es un estimador de un parámetro?

El estimador de un parámetro es un estadístico


(estadístico: variable aleatoria función de las
observaciones muestrales) que toma «valores
cercanos» al verdadero valore del parámetro.

Fundamentalmente nos interesan los siguientes


estimadores:

 La media muestral x es un estimador de la


media poblacional μ.
 El desvío estándar muestral s es un
estimador del desvío estándar poblacional σ
 La proporción muestral ρ^, es un estimador
de la proporción poblacional P.
Parámetros poblacionales y estimadores de esos parámetros

¿Qué es un estadístico de prueba?

Un estadístico de prueba es:

 Una variable aleatoria


 De distribución conocida
 Que vincula a un parámetro de interés, con un
estimador de ese parámetro.
Veamos algunos ejemplos de estadísticos de prueba.

DISTRIBUCION NORMAL TABLA “Z” (n≥30)

Si X∼N(μ,σ), y X1,X2,…,Xn, es una muestra aleatoria


de X, y conocemos σ entonces:
Es un estadístico de prueba.
Porque es una variable aleatoria, con distribución
conocida (normal estándar), y que relaciona al
parámetro μ con su estimador x.
Observación: no demostramos recién por qué
es esa la distribución

La fundamentación tiene que ver con:


1. Si X es normal, una combinación lineal
de Xi va a ser normal también.
2. La esperanza de Xes μ.
3. La varianza de X es σ2/n
4. La estandarización de variables aleatorias
normales.

DISTRIBUCIÓN “ t ” TABLA t STUDENT ( n ≤ 30)

Si X∼N(μ,σ), y X1,X2,…,Xn, es una muestra aleatoria


de X, y no conocemos σ pero lo estimamos
con S entonces:

Es un estadístico de prueba. Porque es una variable


aleatoria, con distribución conocida (t de student n–
1 grados de libertad), y que relaciona al
parámetro μ con su estimador X.
DISTRIBUCION PARA LA PROPORCION

Si X∼Bernoulli(p) y X1,X2,…,Xn es una


muestra aleatoria de X, con N>30 entonces:

Es un estadístico de prueba. Porque es una variable


aleatoria, con distribución conocida (en realidad
aproximadamente conocida, porque se aproxima a la
distribución normal estándar), y que relaciona al
parámetro p con su estimador p^.
Observación: no demostramos por qué es esa la
distribución. Tiene que ver con el teorema central del
límite.

TEOREMA LIMITE CENTRAL

Si X∼N(μ,σ) y X1,X2,…,Xn, es una muestra aleatoria de


X, entonces:

Es un estadístico de prueba. Porque es una variable


aleatoria, con distribución conocida, y que relaciona al
parámetro σ2 con su estimador S2.
Observación: no demostramos por qué es esa la
distribución. Hay que aceptarlo así.

Lo anterior lo podemos resumir en una tabla que nos indique


las condiciones que deben darse, con el parámetro de interés
y su estadístico de prueba.
¿Qué es una hipótesis estadística?

Una hipótesis estadística es una afirmación acerca de


la distribución de una variable aleatoria.

 Si la afirmación es sobre el valor de un parámetro,


es una hipótesis estadística paramétrica.
 Si la afirmación es sobre la forma de la distribución
de probabilidades, es una hipótesis estadística no
paramétrica.
Ejemplo de prueba de hipótesis detallado paso a paso
(incluyendo los detalles «técnicos»)
El enunciado

Un fabricante de galletas produce paquetes en los


cuales el peso nominal impreso es de 500 gramos. Pero
el contenido real es una variable aleatoria con
distribución normal. Y No tienen
exactamente 500 gramos todos los paquetes. El
fabricante, basándose en información histórica, afirma
que la media de esa variable X es μ=500 gramos con
un desvío estándar de 5 gramos. Se desconfía de la
afirmación del fabricante acerca de que la media
poblacional μ sea igual a 500 gramos. Se quiere
analizar si en realidad el peso promedio de los paquetes
es inferior a 500 gramos.
Para esto se toma una muestra de tamaño 100, y se
obtiene una media muestral X de 497.3 gramos.
Realizar una prueba de hipótesis con un nivel de
significación de 0.05. Y verificar si existe evidencia
suficiente para determinar si el fabricante tiene la
razón.
La variable

La variable sobre la que vamos a trabajar es X: peso


real de un paquete de galletas de 500 gramos de la
fábrica.
El enunciado afirma que la distribución de X es normal.
No se conoce μ, pero sí se conoce σ=5.

Hipótesis nula e hipótesis alternativa (planteamiento)


(H0 ) es la hipótesis nula. Esta es la hipótesis nula es
la hipótesis de no cambio. Siempre en esta hipótesis
va a estar el igual. H0:μ=500 es la hipótesis de que
todo queda igual. La otra hipótesis que es la hipótesis
de cambio.
(H1 )es la hipótesis alternativa. Es complementaria a la
nula. Y Niega o contradice a la hipótesis nula.

Por tanto, las hipótesis son complementarias. La nula


tiene el símbolo de igualdad siempre. Entonces en la
otra no puede aparecer el igual. En la hipótesis
alternativa se utiliza o bien el símbolo de distinto ≠, o
bien mayor > o bien menor <. Para este caso
H1: μ<500

Error de tipo 1 y error de tipo 2

Uno querría tomar la decisión correcta. Rechazar la


hipótesis nula, cuando esta es falsa, es una decisión
correcta posible. No rechazar la hipótesis nula, cuando
esta es verdadera es otra forma de tomar una decisión
correcta.

Pero cuando se toma una decisión basada en


información muestral, se pueden cometer errores. Si la
hipótesis nula fuera verdadera, y tomamos la decisión
de rechazarla estaremos cometiendo un error. Este
error se conoce cómo el error de tipo 1. Si la hipótesis
nula fuera falsa, y no la rechazamos estaríamos
cometiendo otro error. Este otro error se conoce cómo
el error de tipo 2.
En un proceso de prueba de hipótesis, no es posible
tener garantía absoluta de no estar cometiendo algún
error.

La tabla resume los escenarios posibles.

Error de tipo 1: Si la hipótesis nula es en realidad


verdadera, y se la rechaza, se comete el error de tipo 1.
También se llama nivel se significación de la prueba. La
probabilidad de cometerlo se representa cómo:

Decisión correcta 1: Si la hipótesis nula es en


realidad verdadera, y no se la rechaza, se está
tomando una decisión correcta. La probabilidad de que
ocurra esto se representa:
Error de tipo 2: Si la hipótesis nula es falsa y no se la
rechaza, se comete el error de tipo 2. La probabilidad
de cometerlo se representa cómo:

Decisión correcta 2: Si la hipótesis nula es falsa, se


la rechaza, se está tomando una decisión correcta.
Diferente de la decisión correcta 1, así que le podemos
llamar decisión correcta 2. (No es un nombre
estándar). La probabilidad de que esto ocurra se
conoce cómo «potencia del test» y se representa
cómo:

El nivel de significación (probabilidad de cometer el error de tipo 1) se


establece a priori. Es la probabilidad de rechazar la hipótesis nula cuando
esta es verdadera. En general el enunciado del ejercicio (o el investigador)
establece un nivel de significación.

El error de tipo 1 se considera un error grave, que se


quiere evitar. Hay necesidad de controlarlo. (α) debe
ser pequeño. Valores usuales
de α pueden ser:

Estadístico de prueba

Basándonos en queX∼N(μ,σ), y que conocemos σ,


entonces es posible afirmar que:
Este es un estadístico de prueba que nos puede servir
para realizar la prueba de hipótesis sobre μ (promedio
poblacional).
En el proceso se asume que H0 es verdadera hasta
que se demuestre lo contrario (cómo en un juicio se supone la
inocencia hasta que se demuestre lo contrario).
Si asumimos que H0 es verdadera (μ=500) entonces el
estadístico de prueba
es:

En el numerador tenemos la diferencia (X–μ) si esa


diferencia es «muy negativa» entonces rechazaremos
la hipótesis nula (porque significa que X está muy por
debajo de μ).
Entonces ¿Cómo se decide si se rechaza o no a la hipótesis
nula? Los valores que puede tomar el estadístico de prueba
se dividen en dos zonas: «la zona de rechazo» y la «zona de
no rechazo». Si el estadístico de prueba toma un valor
dentro de la zona de rechazo se rechaza la hipótesis nula. Si
el estadístico de prueba toma un valor fuera de la zona de
rechazo, no se rechaza la hipótesis nula.

H0

Rechazaremos H0 si:

Nivel de significación
En este ejemplo se establece que el nivel de
significación (probabilidad de cometer el error de tipo
1) α=0.05.
Zona de rechazo y regla de decisión

Si el estadístico de prueba cae en zona de rechazo


(asumiendo H0verdadera) estaríamos cometiendo el
error de tipo 1 (RH0|H0 es V). Luego el nivel de
significación es igual al área bajo la curva del
estadístico de prueba y sobre la región de rechazo.

Entonces: el nivel de significación determina,


conjuntamente con la distribución del estadístico de
prueba, cuál va a ser el valor crítico que define la zona
de rechazo.

zC (nivel de sifgnificancia),debe ser aquel valor de la


variable normal estándar que acumula un área de 0.05
a su izquierda. observando la tabla de probabilidades
normales, o bien usando un software, se puede
determinar que:

Regla de decisión:

 Se rechaza H0 si el valor observado del estadístico


de prueba es menor o igual a (–1.64).
 No se rechaza H0 si el valor observado del
estadístico de prueba es mayor que(–1.64).
Calcular el valor observado del estadístico de prueba

Hasta aquí no se utilizó la información recogida en la


muestra. Recién ahora tomamos el dato sobre la
media muestral observada y reemplazamos en la
expresión de estadístico de prueba para obtener el
valor observado del estadístico de prueba:

Obtener la conclusión

En general la conclusión tiene dos versiones: una


breve, y otra más detallada.

LA CONCLUSIÓN BREVE (O «LA DECISIÓN»)

Cómo el valor observado del estadístico de prueba


(-5.4), cae en la zona de
rechazo (–∞,–1.64)(–∞,–1.64) se
decide rechazar la hipótesis nula.
Esta conclusión está muy bien, pero no refiere a la
situación general del problema concreto. Solo dice si
se rechaza o no la hipótesis nula.

LA CONCLUSIÓN DETALLADA

En la conclusión detallada queremos informar:

 El nivel de significación con el que se realiza la


conclusión.
 Cuál es la variable en cuestión.
 Cuál es el parámetro en cuestión.
 Si se rechaza o no se rechaza la hipótesis nula a
favor de la alternativa.
 Qué implica la decisión tomada en términos del
problema concreto
Para este caso podríamos escribir concluirasí:

Con un nivel de significación de 0.05 se rechaza la


hipótesis nula, que afirma que la media del peso de los
paquetes de galletitas es de 500500 gramos, a favor de
la hipótesis alternativa, que afirma que la media del
peso de los paquetes de galletitas es inferior
a 500 gramos. Por tanto habría que recalibrar la
máquina que rellena los paquetes para que la media
sea de 500 gramos.
Pasos que se dan para realizar una prueba de hipótesis
Después de haber resulto completamente un ejercicio
de prueba de hipótesis podemos detectar que se
siguió la siguiente secuencia de pasos:

1. Primer paso: Reconocer y definir la o las variables


2. Segundo paso: Formular las hipótesis nula y
alternativa
3. Tercer paso: Establecer un estadístico de prueba
adecuado
4. Cuarto paso: Seleccionar un nivel de significación
5. Quinto paso: Determinar la zona de rechazo y
establecer la regla de decisión
6. Sexto paso: Calcular el valor observado del
estadístico de prueba
7. Séptimo paso: Obtener la conclusión

Primero: rechazo o no (H0 )


Luego: expresarla en términos del problema

También podría gustarte