El estudio de una población
Estudio de
abarca:
una
población
Estimación de Prueba de
parámetros hipótesis
Prueba de la Prueba de Prueba de la
media para una proporciones para varianza para una
muestra una muestra muestra
Prueba de hipótesis e Intervalo de confianza para una media
Prueba de la
Se emplea en los siguientes escenarios: media para una
• Se necesita conocer el intervalo de confianza para la media de la muestra
población
• Comparar el parámetro de la población con un valor teórico. Prueba z para una
• Si se conoce la varianza poblacional, el error estándar puede ser muestra
calculado directamente y la prueba Z es la más apropiada, utilizando
la tabla de distribución estándar (μ=0, σ= 1).
Prueba t para una
• Cuando no se conoce la varianza poblacional, el error estándar se muestra
obtiene a partir de los datos de la muestra y se emplea la prueba t de
Student, utilizándose la tabla de dicha distribución.
Prueba z para una media
Fundamento del estudio de una población: Distribución muestral de medias
Si se obtienen todas las posibles muestras aleatorias de tamaño (n)
de una población con media µp y desviación estándar σp. La
distribución muestral resultante tendrá las siguientes características:
1. La media aritmética de la distribución (m) es igual a la media
poblacional µp.
2. La desviación estándar de la distribución de medias (Sm) es
conocida como “error estándar de la media” , ya que implica el error
cometido al realizar la estimación de la media poblacional con base
en la obtención de las muestrales. Su calculo es mediante: Sm= σ/√n
Fundamento del estudio de una población: Distribución muestral de medias
3. Si la población original tiene distribución Normal, entonces para
cualquier tamaño muestral n la distribución de la media muestral es
también Normal.
4. Si la población de origen no es Normal, pero n es
“suficientemente” grande la distribución de la media muestral es
aproximadamente Normal. (un tamaño suficiente es considerado de
30)
5. Virtualmente todas los estadísticos provenientes variables
aleatorias y con base en un muestreo aleatorio siguen este
comportamiento
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos (restricciones): población normal (n ≥ 30)
Varianza poblacional conocida (σ2), muestra aleatoria
• Hipótesis: HO: µ = µ0 y H1: µ > µ0; µ < µ0; µ ≠ µ0
• Intervalo de confianza =
• Estadístico de prueba = Zcalc =
• Error estándar de la distribución EEμo =
σ
√n
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos (restricciones): población normal (n ≥ 30)
Varianza poblacional conocida (σ2), muestra aleatoria
• Hipótesis: HO: µ = µ0 y H1: µ > µ0; µ < µ0; µ ≠ µ0
• Intervalo de confianza =
• Estadístico de prueba = Zcalc
= ± zα . EE
-μ0
• Error estándar de la distribuciónEEEEμo =
μo
σ
√n
prueba z para una muestra: ejercicio de comprensión
De acuerdo con los parámetros requeridos por una empresa ensambladora de autos, el
nivel de producción para cada una de sus fabricas debería ser de 15 autos en promedio
por día con una d.e. 1.5 autos. Al revisar la producción por día de una de sus fabricas en
forma aleatoria durante un mes se encontraron los siguientes resultados:
X = {numero de autos producidos por día}
x f
17 4 Considerando un nivel de confianza del 90%:
16 5 • ¿Cual es el nivel de producción de autos de la fabrica?
15 6
14 1
13 3 • ¿Puede afirmarse que la fabrica cumple con el estándar
12 1 de la empresa?
Σ 30
ejercicio de comprensión
x f
17 4
16 5
15 6
14 1
13 3
σ=
12 1
μ0=
Σ 30
=
α=
x f x.f
17 4
16 5
15 6
14 1
13 3
σ=
12 1
μ0=
Σ 30
=
α=
prueba z para una muestra: ejercicio de comprensión
De acuerdo con los parámetros requeridos por una empresa ensambladora de autos, el
nivel de producción para cada una de sus fabricas debería ser de 15 autos en promedio
por día con una d.e. 1.5 autos. Al revisar la producción por día de una de sus fabricas en
forma aleatoria durante un mes se encontraron los siguientes resultados:
X = {numero de autos producidos por día}
x f
17 Considerando un nivel de confianza del 90%:
16 • ¿Cual es el nivel de producción de autos de la fabrica?
15
14
13 • ¿Puede afirmarse que la fabrica cumple con el estándar
12 de la empresa?
Σ
prueba z para una muestra: ejercicio de comprensión
Un centro educativo de nivel básico afirma que ha desarrollado un nuevo método de
enseñanza que le ha permitido superar la media nacional en comprensión lectora. De
acuerdo con investigaciones previas la media nacional de comprensión lectora en una
prueba estandarizada es de 120 con una desviación estándar de 5. Para poner aprueba
dicha afirmación se obtuvo una muestra aleatorizada del centro. Obteniendo lo siguiente:
X = {resultado en la prueba}
X f Considerando un nivel de confianza del 95%:
140-149 7 • ¿Cual es el nivel de comprensión lectora en la escuela?
130-139 5
120-129 10
110-119 5 • ¿Puede afirmarse que el nivel de comprensión lectora es
100-109 3 mayor al nivel nacional?
Σ 30
prueba z para una muestra: ejercicio de comprensión
X f Xpm Xpm.f
140-149 7
130-139 5
120-129 10
110-119 5
100-109 3
Σ 30
σ=
μ0=
=
α=
Desarrolle el ejercicio #1 del
archivo “Ejercicio análisis de una
población”
Parte 1
Un hospital psiquiátrico afirma que, gracias a su nuevo tratamiento, el nivel de depresión de sus
pacientes hospitalizados es menor al del resto del país. Para de mostrarlo selecciono una muestra
aleatorizada de sus pacientes y evaluó su nivel de depresión mediante el inventario de depresión de
beck.
Tomando en cuenta que el nivel de sintomatología depresiva
x f f.x para pacientes hospitalizados en el país es de 32.5 en
34 7 promedio con una desviación estándar de 2 puntos.
33 8 Responda a las siguientes preguntas considerando un nivel de
32 10 confianza del 90 pct:
31 10
30 9 ¿Cuál es el nivel de depresión de los pacientes
hospitalizados de dicho hospital?
29 8
Σ ¿Es correcta la afirmación del hospital?
Parte 2
De acuerdo con diversas investigaciones, el promedio de tiempo que necesita un empleado para
llegar a su trabajo tiene una media de 35 minutos con una desviación estándar de 12 minutos. Con
el fin de corroborar esta información se obtuvo una muestra aleatorizada de 70 trabajadores del
municipio de Texcoco obteniendo los siguientes resultados:
x f xpm f.x Con base en la información anterior responda a las siguientes
preguntas considerando un nivel de confianza del 99 pct:
50-59 12
¿Cuál es tiempo de traslado de los habitantes de Texcoco?
40-49 11
30-39 24
20-29 13
¿Es posible afirmar que el tiempo de traslado de los habitantes de
10-19 10 texcoco se asemeja al observado previamente?
Σ 70
Prueba t de student para una media
Distribución t de student
Cuando el tamaño muestral “n” es pequeño, el estadístico z no tiene una
distribución normal, por lo que no es posible realizar inferencias sobre la
probabilidad de un evento. Por lo que es necesario utilizar la distribución “t de
student” • Tiene forma de montículo y es simétrica
alrededor de t = 0, igual que z.
• Es más variable que z, con “colas más pesadas”;
esto es, la curva t no aproxima al eje horizontal
con la misma rapidez que z.
• La forma de la distribución t depende del
tamaño muestral n.
Construcción de un intervalo de confianza en la distribución t de student
1-α =
Encontrar los valores de z que delimitan un intervalo de confianza al 99 %
α=
IC1-α = (tα/2 ; t1-α/2)
gl= n-1 =
t=0
tα/2 t1-α/2
Prueba de hipótesis de cola derecha en la distribución t de student
1-α =
Encontrar los valores de z que delimitan una prueba de hipótesis de cola derecha
αcon
= un nivel de confianza al 80 %
IC1-α = (t1-α)
gl= n-1 =
t=0
t1-α
Prueba de hipótesis de cola izquierda en la distribución t de student
1-α =
Encontrar los valores de z que delimitan una prueba de hipótesis de cola derecha
αcon
= un nivel de confianza al 95 %
IC1-α = (tα)
gl= n-1 =
t=0
tα
Desarrolle el ejercicio #2 del
archivo “Ejercicio análisis de una
población”
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos (restricciones): población normal o n ≥ 30
Varianza poblacional desconocida, muestra aleatoria.
• Hipótesis: HO: µ = µ0 y H1: µ > µ0; µ < µ0; µ ≠ µ0
• Intervalo de confianza =
• Estadístico de prueba = tcalc =
S
• Error estándar de la distribución EEμo = √n gl = n-1
• Grados de libertad (gl) = n-1
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos (restricciones): población normal o n ≥ 30
Varianza poblacional desconocida, muestra aleatoria.
• Hipótesis: HO: µ = µ0 y H1: µ > µ0; µ < µ0; µ ≠ µ0
• Intervalo de confianza =
• Estadístico de prueba = tcalc
= ± tα . EE
-μ0
• Error estándar de la distribuciónEEEEμo =
μo
S
• Grados de libertad (gl) = n-1
√n
Un centro de atención psicológica evaluó el nivel de adherencia terapéutica en
pacientes diagnosticados con diabetes mediante una muestra aleatoria obteniendo los
siguientes resultados:
x = {numero de días en los que el paciente es adherente al tratamiento}
x f
Considerando un nivel de confianza del 90 pct:
15 2 • ¿Cuál es el nivel de adherencia terapéutica de los pacientes del
14 4 centro?
13 3
12 2
11 1 • ¿El nivel de adherencia de los pacientes es igual al de 14 días
Σ recomendados?
x = {días en los que el paciente es adherente al tratamiento}
x f x. f x- (x - )2 f(x - )2
15 2
14 4
13 3
12 2
μ0=
11 1
Σ =
S=
α=
A continuación se muestran el nivel de flexibilidad cognitiva de un grupo de
estudiantes universitarios seleccionados mediante una muestra aleatorizada.
x = {numero de días en los que el paciente es adherente al tratamiento}
x f Considerando un nivel de confianza del 99 pct:
16-20 10 • ¿Cuál es el nivel de adherencia terapéutica de los pacientes del
11-15 8 centro?
6-10 8
1-5 4 • ¿Podría afirmarse que el nivel de flexibilidad cognitiva es mayor
Σ a 11?
x = {días en los que el paciente es adherente al tratamiento}
x f xpm xpm . f xpm - (xpm - )2 f(xpm - )2
16-20 10
11-15 8
6-10 8
1-5 4
μ0=
Σ
=
S=
α=
Desarrolle el ejercicio #3 del
archivo “Ejercicio análisis de una
población”
1) En una prueba a programas de pérdida de peso, 40 adultos utilizaron
el programa de pérdida de peso Atkins. Después de 12 meses, se
descubrió que su pérdida de peso promedio era de 2.1 lb, con una
desviación estándar de 4.8 lb. Construya una estimación del intervalo
de confianza del 90% para la pérdida de peso media de todos estos
sujetos.
2) A continuación, se listan las cantidades de años que requirió una muestra
aleatoria de estudiantes universitarios para obtener títulos de licenciatura.
Con base en la información anterior responda a
x- las siguientes preguntas considerando un nivel de
x f x. f (x - )2 f(x - )2
9 1 confianza del 95 pct:
8 2
• ¿Cuál es el tiempo que demoran los alumnos
6 6
5 7 en obtener su título ?
4 8
• ¿Se puede inferir que los estudiantes
Σ
universitarios generalmente obtienen títulos
de licenciatura en cuatro años?
Se realizo una investigación sobre el nivel de estrés escolar en alumnos de
nivel superior inscritos a universidades públicas de la ciudad de México,
mediante una muestra aleatoria obteniendo los siguientes resultados:
Responda a las siguientes preguntas considerando un
x f xpm f.x x - (x - )2 f(x - )2
nivel de confianza de 99.9%:
50-60 4 ¿Cuál es el nivel de estrés escolar de los alumnos de la
40-50 2 ciudad de mexico?
30-40 1
20-30 3
10-20 2 ¿Puede afirmarse que el nivel de estrés escolar es
Σ menor al de la media nacional de 52 puntos?
Prueba de proporciones para una
muestra
DISTRIBUCION
Muchas BINOMIAL
poblaciones consisten sólo de dos tipos de elementos que corresponden a
categorías mutuamente excluyentes, en las cuales el investigador se interesa únicamente
al proporción, porcentaje o numero de individuos que se encuentran en una de estas
clases:
• Porcentaje de hombres en un grupo
• Hombre – Mujer
• Porcentaje de pacientes con depresión
• Con depresión – sin depresión
• Porcentaje de alumnos reprobados
• Aprobado – Reprobado
• Porcentaje de desempleados en una comunidad
• Empleado – Desempleado
• Porcentaje de alumnos presentes en cada sesión
• Presente – Ausente
• Porcentaje de personas con depresión que acuden a
• Con tratamiento – Sin tratamiento
tratamiento
DISTRIBUCION BINOMIAL
Ensayo de Bernoulli :Experimento aleatorio en el que sólo se pueden obtener dos
resultados: éxito y fracaso.
Donde:
Otros pacientes p = probabilidad de tener un éxito
q = probabilidad de tener un fracaso
Depresión 40
60
Al muestrear, a cada observación que cae en la clase de interés primario se le llama éxito.
p+q=1
En una muestra de tamaño n la probabilidad de obtener 0, 1, 2, 3..., n éxitos se calcula a
través de la distribución llamada binomial
DISTRIBUCION BINOMIAL
Suponga que la probabilidad de que un paciente hospitalizado presente depresión es de
60 porciento. Suponiendo que se seleccionan 100 pacientes
X = numero de pacientes que presentan depresión en 100 selecciones
100!
P(x=60) = .660 . 440 = 0.0812
40! 60!
100!
P(x=20) = .620 . 480 = 2.864 x 10-16
80! 20!
Distribución normal
Px
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
86
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
86
56
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
71
86
56
41 101
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
71 76
86
56
51
41 101
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
71 76
61
86
56
51
46
41 101
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
66 71 76
61 81
86
56
91
51
46 96
41 101
36 106
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
66 71 76
61 81
86
56
91
51
46 96
41 101
36 106
X
X = numero de pacientes que presentan depresión en 100 selecciones
Distribución normal
Px
= n.p
S = √n.p.q
X
X = numero de pacientes que presentan depresión en 100 selecciones
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos: numero grande de experimentos np ≥ 5 y nq ≥ 5
• Hipótesis: HO: π = π0 y H1: π > π0; π < π0; π ≠ π0
• Intervalo de confianza =
• Estadístico de prueba = Zcalc =
• Error estándar de la distribución EEπo =
√ p.q
n
Prueba de una media con varianza conocida: “prueba z para una muestra”
Permite probar si la media de la población µ difiere respecto a
un valor hipotético µ0
• Supuestos: numero grande de experimentos np ≥ 5 y nq ≥ 5
• Hipótesis: HO: π = π0 y H1: π > π0; π < π0; π ≠ π0
• Intervalo de confianza =
p ± zα . EE
• Estadístico de prueba = Zcalc =
p -π0
• Error estándar de la distribución EE
EEπo
πo =
√ p.q
n
Supongamos que 200 individuos en una muestra de estudiantes universitarios de la
zona metropolitana del valle de mexico 1000 padecen trastorno de ansiedad
generalizada (TAG). Considerando un nivel de confianza del 90 pct:
• ¿Qué porcentaje de estudiantes universitarios padece TAG?
• ¿El porcentaje de universitarios con TAG es igual al porcentaje nacional (.25)?
α=
π0=
p=
q=
Supongamos que 7000 individuos en una muestra de estudiantes universitarios de la
zona metropolitana del valle de mexico 50,000 padecen trastorno depresivo.
Considerando un nivel de confianza del 99.9 pct:
• ¿Qué porcentaje de estudiantes universitarios padece un trastorno depresivo?
• ¿El porcentaje de universitarios con depresion es igual al porcentaje nacional (.10)?
α=
π0=
p=
q=
Desarrolle el ejercicio #4 del
archivo “Ejercicio análisis de una
población”
En un estudio realizado en el estado de México se observó que 550 personas en una muestra
de 1700 presentaban violencia intrafamiliar. Considerando un nivel de confianza del 80 pct:
• ¿Qué porcentaje de personas en el estado de México presentan violencia intrafamiliar?
• ¿Podría afirmarse que el porcentaje es menor al observado el año anterior? (40 %)
De acuerdo con un estudio elaborado por la UNAM cerca del 30 por ciento de los estudiantes universitarios no
terminan su proceso de titulación. Con el fin de corroborar dicha información, un estudio obtuvo una muestra de 700
estudiantes egresados, de los cuales 198 terminaron satisfactoriamente su proceso de titulación
• ¿Qué porcentaje de estudiantes universitarios terminan satisfactoriamente su proceso de titulación?
• ¿Podría afirmarse que los datos observados en el estudio coinciden con la información proporcionada por la UNAM?