RUTA ESTIMACIÓN DE PARÁMETROS A TRAVÉS DE INTERVALOS DE CONFIANZA
Recordemos la noción del TEOREMA DEL LÍMITE CENTRAL, para abordar en que están cimentados todos los
supuestos con que elaboramos los intervalos de confianza.
También se debe recordar que una estimación la realizamos acerca de los parámetros desconocidos de una
población, esta es la razón fundamental por la cual se hace inferencia estadística.
¿Porque se debe utilizar intervalos de confianza para realizar estimaciones de los parámetros y no simplemente las
estimaciones de estos parámetros?
Dado que los estimadores puntuales pocas veces serán iguales a los parámetros que tratan de estimar, podemos
darnos una mayor libertad en su estimación mediante el uso de la "estimación por intervalos" o "intervalos de
confianza".
Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de un parámetro.
Esto se puede corroborar con el siguiente experimento:
Sea 4, 6, 8 tres elementos que de una población de tamaño 3 (N = 3), donde µ = 6
Si seleccionamos todas las posibles muestras de tamaño 2 (n = 2) y calculamos la media en cada muestra, Por
ejemplo:
Muestra M e d i a
Muestral (x́)
4,4 4
4,6 5
4,8 6
6,4 5
6,6 6
6,8 7
8,4 6
8,6 7
8,8 8
Como se puede observar, en todas las posibles realizaciones de las muestras de tamaño 2, solo en tres de las nueve
realizaciones de la muestra, es igual el estimador al parámetro, es decir, para este ejercicio la probabilidad de que el
estimador sea igual al parámetro basando la inferencia solo en el estimador puntual de la media es del 33.3% (P=
3/9)
Se debe tener en cuenta que en la práctica solo se puede tener una realización de una muestra y esta es escogida
por medio de métodos aleatorios y esperando que sea representativa, entonces en general hay una probabilidad
más grande de equivocarse cuando la inferencia se lleva a cabo solo con una estimación puntual.
Definición: Sea (1-α) una probabilidad especificada alta y sean Z1 y Z2, dos estadísticos tales que P[Z1 < θ < Z2] = 1-α
El intervalo [Z1, Z2] recibe el nombre de Intervalo de Confianza del 100(1-α)% para el parámetro desconocido θ. Las
cantidades Z1, Z2 reciben el nombre de Límites de confianza inferior y superior, respectivamente, y (1-α) es el Nivel
de Confianza asociado con el intervalo.
(Para los casos que atañe con el cumplimiento de los objetivos planteados al inicio del curso puede reemplazar θ
por µ o por π como parámetros a estimar)
La interpretación de un intervalo de confianza radica en la interpretación de una probabilidad de largo plazo, y es
que, si se recopila un número grande de muestras aleatorias y se calcula un intervalo de confianza del 100(1-α)%
para el parámetro θ para cada una de las muestras, entonces el 100(1- α)% de esos intervalos contienen el valor
verdadero de θ (Metodología estadística) y se corre un riesgo de encontrar (α)% de estos intervalos que NO
contengan el verdadero valor de θ .
De acuerdo con la interpretación, el nivel de confianza del 100(1-α)% no es tanto un enunciado sobre un intervalo
particular, sino, que pertenece a lo que pasaría si se construyera un número grande de intervalos semejantes.
La probabilidad es 1-α de que el intervalo aleatorio contenga el verdadero valor del parámetro desconocido θ. El
parámetro θ es una constante, aunque desconocida, y los intervalos Z1 y Z2 son variables aleatorias.
(1-α)% se conoce como el nivel de confianza que se tiene, de que el parámetro de la población está contenido en la
realización de la muestra escogida aleatoriamente.
Construcción de un intervalo de confianza para la media de la Población µ
Ejemplo. Cálculo de un intervalo de confianza para µ, con varianza σ² conocida.
Debemos encontrar dos estadísticos Z1 y Z2 tales que P[Z1 < µ < Z2] = 1-α
1−α
α/2 α/2
Z1 µ Z2
El estadístico a usar corresponde a la media muestral x́ que es el mejor estimador de la media poblacional µ.
Sabemos que la media muestral x́ se distribuye normalmente con valor esperado µ y varianza σ²/n, entonces la
x́−μ
variable asociada será: Z= tiene una distribución normal estándar. Esto se demuestra mediante el uso del
σ /√n
TEOREMA DEL LÍMITE CENTRAL.
Por lo tanto, y si a y b son dos valores constantes tales que:
P(a <x́ < b) = (1 – α)% como lo vimos en la distribución muestral para la media y conociendo la distribución de x́, la
probabilidad anterior se puede expresar como:
P ( σa−μ <
x́−μ b−μ
/√ n σ / √ n σ / √ n )
< =1−∝
x́−μ
Como la variable Z= tiene una distribución normal estándar, y la probabilidad es 1-α, entonces queda una
σ /√n
probabilidad total de α para los dos extremos, la cual se divide en dos partes. Si denotamos por Z α /2 y Z1−α /2 los
valores de la distribución normal que tienen probabilidades acumuladas de (α/2) y 1-(α/2), respectivamente,
entonces la probabilidad dada en la ecuación anterior se puede escribir como:
x́−μ
(
P −Z α / 2<
σ /√n )
< Z 1−α /2 =1−∝
x́ −μ
Manipulando la parte inferior de la desigualdad −Z α /2 < para expresarla en términos de µ obtenemos que es
σ /√ n
σ
equivalente a μ< x́ +Z α /2 . En forma similar, manipulando la parte superior de la desigualdad obtenemos que
√n
σ
μ> x́−Z 1−α / 2 . Combinando los resultados anteriores, la ecuación anterior de la probabilidad se puede escribir
√n
como:
σ σ
(
P x́−Z α / 2
√n
< μ< x́+ Z 1−α / 2
√n )
=1−∝
σ
Comparando la ecuación anterior con la definición de los intervalos de confianza vemos que los valores x́−Z α / 2 y
√n
σ
x́ +Z 1−α /2 corresponden a los límites de los intervalos de confianza Z1 y Z2 mencionados al definir lo que es un
√n
intervalo de confianza. Por lo tanto, el intervalo de confianza para µ está dado por:
σ σ
x́−Z α / 2 < μ< x́ + Z 1−α /2
√n √n
Por la simetría α/2 = 1-α/2, se puede expresar el intervalo de confianza también como : x́ ¿
Debe observarse que el intervalo de confianza es aleatorio, ya que sus límites dependen de x́, que es una variable
aleatoria. La longitud o amplitud del intervalo es constante y equivale a dos veces el error de muestreo (e) y es igual
a 2 ¿ ¿) y lo que varía es el punto medio (se toma la media muestral como pivote). Si para un mismo nivel de
confianza queremos reducir el tamaño de intervalo, necesariamente tenemos que usar un tamaño de muestra
mayor.
El error en la estimación o de muestreo de la media poblacional (o error de muestreo de la media), definido como
σ
|x́−μ| es igual a Z α /2 .
√n
INTERVALOS DE CONFIANZA PARA UNA PROPORCIÓN π
Para el intervalo de confianza para la proporción se toma en cuenta el mismo procedimiento que se elaboró para el
intervalo de confianza de la media con la diferencia que la estimación puntual y el error estándar de estimación son
diferentes.
Teorema. Si p es la proporción de observaciones que pertenecen a una clase de interés en una muestra aleatoria de
tamaño n, entonces un intervalo de confianza aproximado de 100(1-α)% para la verdadera proporción π de la
población que pertenece a esta clase es:
p (1− p ) p(1− p)
(
P p−Z α /2
n √ ≤ π ≤ p +Z α /2
√ n )
=1−α
También se puede definir como:
p(1− p)
p ( ±) Zα/ 2
√ n
Intervalo de confianza para la media poblacional con Varianza desconocida y muestras pequeñas
Cuando la varianza de una población que se distribuye Normal no es conocida, y se tiene una muestra de tamaño
menor de 30 elementos, no se puede usar la distribución normal estándar, sino que en su lugar se debe emplear la
distribución t. Es decir, la variable T definida de la siguiente manera sigue una distribución t con n-1 grados de
libertad.
x́−μ
T= se distribuye T (n−1)
s/√n
Si x́ y s son la media muestral y la desviación estándar de una muestra tomada de una POBLACIÓN CON
DISTRIBUCIÓN NORMAL con varianza σ² desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-α)%
para µ será aquel que cumpla que: P[T1 < µ < T2] = 1-α
x́−μ
De nuevo el estadístico a usar corresponde a la media muestral x́, entonces la variable asociada será T = que
s /√n
tiene una distribución t con n-1 grados de libertad. Por lo tanto si a y b son dos valores constantes tales que P(a < x́
< b) = 1-α, lo cual a su vez puede expresarse como:
P ( σa−μ <
x́−μ b−μ
/√ n σ / √ n σ / √ n )
< =1−∝
Si vamos a considerar intervalos de confianza simétricos, entonces la anterior probabilidad puede escribirse como:
x́−μ x́−μ
(
P −t n−1 ;α / 2 <
σ /√n )
<t n−1 ;α / 2 =1−∝Manipulando la parte inferior de la desigualdad t n−1; α / 2<
s/ √ n
para expresarla en
s
términos de µ obtenemos que es equivalente a μ< x́ +t n−1; α/2 . En forma similar, manipulando la parte superior de
√n
s
la desigualdad obtenemos que μ> x́−t n−1 ;α / 2 . Combinando los resultados anteriores, la ecuación anterior de la
√n
probabilidad se puede escribir como:
s s
(
P x́−t n−1 ;α / 2
√n
< μ < x́+ t n−1 ;α /2
√n )
=1−∝Comparando la ecuación anterior con la definición de los intervalos de
s s
confianza vemos que los valores x́−t n−1 ;α / 2 y x́ +t n−1 ;α /2 corresponden a los límites de los intervalos de
√n √n
confianza T1 y T2 mencionados al definir lo que es un intervalo de confianza.
EJERCICIOS DE INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL O LA PROPORCIÓN POBLACIONAL PARA
UN GRUPO
(Se debe tener la copia de la tabla t de student y la Z normal estándar)
1. Una firma de transporte garantiza a sus clientes que los despachos de Cali a Cualquier parte del país promedian
5 días o menos, con una desviación estándar de 2 días. Un cliente en particular halla de una muestra de 36
despachos y observa que sus tiempos han promediado 6 días. Halle un intervalo de confianza del 95%, para
estimar el tiempo promedio de despachos ¿Debería de rechazar la compañía el argumento de la firma de
transporte sobre que los envíos toman 5 días o menos?
R/= No dice que el tiempo de envío se distribuye normal, pero como n es > o igual a 30 (n=36) se asume
aproximadamente normal, ahora bien ¿Se conoce la desviación o la varianza poblacional? Si, la desviación de la
población es 2 (fíjese que cuando se da ese dato todavía no han hablado del tamaño de la muestra, por eso se
asume poblacional)
Si se conoce la desviación poblacional se trabajará con la distribución Z normal estándar y por lo cual se utilizará
el siguiente intervalo:
σ σ
[ X̄−z α
2 √n
, X̄ + z α
2 √
n ]
¿Cuánto vale la media de la muestra? o sea X = 6
El único valor que falta por definir es Z α/2, que lo define la confiabilidad del intervalo, la cual es del 95%
α α
2 2
95%
2.5% 2.5%
−z α zα
0 2 1−α 2 1
Z α/2 = en porcentaje será desde 0 hasta donde está Z α/2 pero positivo, por lo tanto, el porcentaje es de 2.5% +
95% que en total es 97.5%, este valor se busca en la parte interna de la tabla Z normal estándar como 0.9750,
encontrándose el valor de Z α/2 como 1.96.
Luego entonces el intervalo será:
6 +/- [1.96 * (2 / √ 36) ]
6 +/- [1.96 * 0.333)]
6 +/- [0.65268]
De ahí que el intervalo sea = El límite inferior = 6 – 0.65268 = 5.347
= El límite superior = 6 + 0.65268 = 6.653
Con una alta confiabilidad (o una confiabilidad del 95%) se puede decir que uno de los intervalos que contiene el
valor de la media de tiempo de envío poblacional estimado está entre 5.35 y 6.65 días, luego entonces el 5 (5
días) no está contenido, pero como dice que son 5 días o menos, el intervalo debería estar de 5 hacia abajo.
Con una alta confiabilidad, se puede decir que la firma de transporte no tiene la razón.
2. Una máquina despachadora de refrescos se ajusta de tal forma que la cantidad de refresco servido está
distribuido normal. Se verifica la máquina periódicamente, tomando una muestra de 10 refrescos y se calcula su
contenido promedio. Halle un intervalo de confianza del 95%, para la cantidad promedia de llenado, las lecturas
en ml fueron: 226 226 232 227 225 228 225 228 229 230.
R/= como dice que la cantidad de refresco servido se distribuye normal (que es la variable aleatoria X de este
problema), pero como n es < a 30 (n=10) se asume normal, pero se utilizará la distribución t de student, por que
no se conoce la desviación o la varianza poblacional y se debe estimar la desviación poblacional con la
desviación muestral S (la cual se halla con los 10 datos dados)
S = con una de las calculadoras es X σ ,n-1 (recuerde utilizar el mode SD y luego por m+ introducir los datos)
Cuando halla introducido los 10 datos le da la tecla X σ ,n-1 para obtener S y la tecla X para obtener la media
muestral, con otra sería s y la tecla X .
Por lo tanto n = 10 S = 2.27 ml X = 227.6 ml
Como no se conoce la desviación poblacional y n< 30, se trabajará con la distribución t de student con n-1
grados de libertad y por lo cual se utilizará el siguiente intervalo:
s s
[ X̄−t α
2 √n
, X̄ +t α
2 √
n ]
El único valor que falta por definir es t α/2, que lo define la confiabilidad del intervalo, la cual es del 95%
De manera similar que con la distribución Z se procede con la distribución t
α α
2
2 95%
2.5% 2.5%
−t α tα
0 2 1−α 2 1
Sí la tabla trae valores superiores de cola (0.90, 0.95, 0.975, 0.99) se procede así
t α/2 = en porcentaje será desde 0 hasta donde está t α/2 pero positivo, por lo tanto, el porcentaje es de 2.5% +
95% que en total es 97.5%,
Pero si la tabla trae valores inferiores de cola (0.10, 0.05, 0.025, 0.01) se procede así:
t α/2 = en porcentaje será desde 0 hasta donde está - t α/2 negativo, por lo tanto, el porcentaje es de 2.5%
solamente.
Este valor se busca en la parte interna de la tabla t de student como 0.975, con (n-1) grados de libertad (10-1
= 9) o se busca en la parte interna de la tabla t de student como 0.025, con (n-1) grados de libertad (10-1 = 9).
En cualquiera de los dos casos encontrándose el valor de t α/2, n-1 como t 0.975, 9 o t 0.025,9 = 2.2622, observe que la
tabla t de student no tiene valores negativos.
Luego entonces el intervalo será:
227.6 +/- [2.2622 * (2.27 / √ 10) ]
227.6 +/- [2.2622 * 0.7178)]
227.6 +/- [1.5979]
De ahí que el intervalo sea = El límite inferior = 227.6 – 1.5979 = 229.1979
= El límite superior = 227.6 + 1.5979 = 226.0021
Con una alta confiabilidad (o una confiabilidad del 95%) se puede decir que uno de los intervalos que contiene el
valor de la media poblacional de llenado del refresco estimada está entre 229.1979 y 226.0021 ml, aquí en este
problema no nos piden verificar el llenado, sino estimar cuánto es el llenado promedio de los refrescos
Con una alta confiabilidad se puede decir que el llenado de los refrescos está entre 229.20 y 226.00 ml.
3. En una investigación sobre hábitos y costumbres de los hogares de cierta comunidad, se estableció que una
quinta parte de estos utilizan estufa de gas. Se tiene alguna razón para pensar que esta proporción es menor, ya
que en una muestra aleatoria de 1000 hogares en esta comunidad se encontró que 236 utilizan estufa de gas
¿Qué conclusión se puede obtener, si se pide trabajar con un intervalo de confianza del 99%?
R/= No dice que la proporción de personas que prefieren estufa de gas (la cual es la variable aleatoria) se distribuye
normal, pero como n es > o igual a 30 (n=1000) se asume aproximadamente normal, ahora bien ¿Qué
parámetro nos interesa? La proporción poblacional, ¿se conoce la desviación o la varianza poblacional? no, pero
se puede estimar con la desviación de la proporción muestral, usando la información, así:
Como es proporción, entonces la desviación de la proporción muestral es ( p(1− p))/n
√
Y cuánto vale p= (los que cumplen / el total de evaluados) = X / n = 236/1000 = 0.236, de ahí que q= 1 – p =
1 – 0.236 = 0.764, observe que aquí tocó hallar la proporción muestral y su complemento, pero hay casos en
que ya viene dado y no hay que hallarlo sino utilizar los valores dados.
Luego entonces la desviación de la proporción muestral será =
√[( 0.236)∗( 0.764)/1000] = √ 0.00018 = 0.0134277
Pero ¿Cuánto es la proporción poblacional a verificar (π) si es cierta?, como nos dicen que en una investigación
anterior se obtuvo una 5ª parte de preferencia por la estufa de gas, lo que es lo mismo = 1/5 = 0.2 o sea el 20%,
de ahí que π = 0.2
Cuando es con proporciones se trabaja con la distribución Z normal estándar y por lo cual se utilizará el
siguiente intervalo:
p ( 1− p) p ( 1− p)
p−z α
2
√ n
, p+ z α
2
√ n
El único valor que falta por definir es Z α/2, que lo define la confiabilidad del intervalo, la cual es del 99%
α α
2 2
99%
0.5% 0.5%
−z α zα
0 2 1−α 2 1
Z α/2 = en porcentaje será desde 0 hasta donde está Z α/2 pero positivo, por lo tanto, el porcentaje es de 0.5% +
99% que en total es 99.5%, este valor se busca en la parte interna de la tabla Z normal estándar como 0.9950,
encontrándose el valor de Z α/2 como 2.575. (Que está en la mitad de 2.57 y 2.58) o puede usar 2.58 más
cercano, según la tabla que tenga.
Luego entonces el intervalo será usando 2.575:
0.236 +/- [2.575 * (√ [( 0.236)∗( 0.764)/1000])]
0.236 +/- [2.575 * 0.0134277)]
0.236 +/- [0.034576]
De ahí que el intervalo sea = El límite inferior = 0.236 – 0.034576 = 0.2014
= El límite superior = 0.236 + 0.034576 = 0.2706
Con una alta confiabilidad (o una confiabilidad del 99%) se puede decir que uno de los intervalos que contiene el
valor de la proporción poblacional de hogares que usan estufa de gas está entre 0.2014 y 0.2706, luego
entonces el 20% no está contenido en el intervalo, por lo tanto, la proporción de hogares que usan estufa de gas
están por encima del 20% (el intervalo debería contenerlo, para decir que si está en el 20%)
Con una alta confiabilidad se puede decir que la proporción es superior al 20%.
TALLER DE INTERVALOS DE CONFIANZA
4. En un proceso de manufactura se produce un 20% de artículos defectuosos. El fabricante seguirá con el proceso
mientras el porcentaje de artículos defectuosos no sea más grande que la norma del 20%. Se selecciona una
muestra aleatoria de 1000 artículos y se inspeccionan. Si salieron 230 artículos defectuosos ¿Cuál es la decisión
correcta? use un intervalo de confianza del 95%.
5. Una máquina automática de café, se diseñó para servir 8 onzas de bebida por taza, con una desviación estándar
de 0.9 onzas. Un analista elige una muestra aleatoria de 36 tazas, para un servicio de pruebas para el
consumidor, la cual obtuvo un promedio de 7.80 onzas, con un intervalo de confianza del 90%, determine si el
diseño cumple con la especificación.
6. En años anteriores el 20% de los clientes indicó la preferencia por el tamaño especial de pizza. Con posterioridad
a una campaña publicitaria realizada en radio y televisión promoviendo dicho producto, se seleccionó una
muestra de 400 clientes. En esta muestra el 22% de los clientes indicó preferencia por el producto. De acuerdo
con estos resultados y usando un intervalo de confianza del 98% ¿Podría decirse que la campaña publicitaria no
fue o si fue efectiva?
7. Un proveedor de remaches para aviones afirma que estos tienen una tensión promedio, la cual se distribuye
normal, con una media como mínimo de 200 kilogramos / fuerza y una desviación estándar de 30 kilogramos /
fuerza. Un fabricante duda de este valor promedio y toma una muestra aleatoria de 25 remaches encontrando
una media de 195 kilogramos / fuerza. Determine si el proveedor cumple con su afirmación, utilice un intervalo
de confianza del 95%.
8. La mayoría de piezas utilizadas en los motores de un avión tienen problemas de desgaste. Una pieza utilizada en
un motor de avión tiene una vida media de 1500 horas, la cual se distribuye aproximadamente normal. Con
ánimo de aumentar la vida media de esta pieza se ha utilizado un nuevo material. Se tomó una muestra de 15 de
las nuevas piezas encontrando una vida media de 1600 horas y una desviación estándar de 100 horas ¿Ha
producido el nuevo material un cambio significativo en la vida media de las piezas? Use un intervalo de
confianza del 98%.
9. En un diario local se afirma que por lo menos el 70% de la población está de acuerdo con la gestión del
presidente de la república sobre el proceso de paz en Colombia. Se toma una muestra de 1000 ciudadanos
mayores de 18 años encontrando una proporción a favor del 65%, defina si puede el diario sostener su
afirmación, use un intervalo de confianza del 90%.
10. Una máquina produce piezas cuyas longitudes se distribuyen normalmente con media 200 mm. Un supervisor
toma una muestra de ocho piezas, obteniendo los siguientes resultados: 210, 190, 205, 220, 200, 208, 198 y 215
mm. Pruebe que los datos de la muestra provienen de una población con media 200 mm. Use un intervalo de
confianza del 98%
11. La temperatura media de operación de un motor de avión durante vuelos de instrucción es de 190º F y se
distribuye aproximadamente Normal. Se prueban 25 motores de aviones idénticos y bajo las mismas
condiciones de operación, encontrándose una temperatura media de 193º F con desviación estándar de 3º F ¿Se
deben preocupar los pilotos que operan estos aviones porque el motor se calienta? utilice un intervalo de
confianza del 95%.
12. Se registró el tiempo transcurrido entre la facturación y la recepción del pago, para una muestra de 100 clientes
en una empresa dada, la media y la desviación estándar son respectivamente: 39.1 días y 17.3 días. Obtenga un
intervalo de confianza del 90% para el tiempo medio entre la facturación y el pago e Interprételo.
13. Empresas anunciadoras de televisión consideran que su publicidad es entendida por la mayoría de los
televidentes, por lo cual para verificar dicha consideración se entrevistaron a 2300 televidentes de los cuales
1914 no entendían la publicidad de dichos anunciantes, con un intervalo de confianza del 95% estime que
porcentaje de televidentes si entienden la publicidad de los anunciantes.
14. En una muestra de 500 residentes de una ciudad, en la cual 210 informaron, que no creen que el impuesto
predial en dicha ciudad sea muy alto. Estime con una confianza del 95% la proporción de residentes que creen
que el impuesto es muy alto ¿Es razonable concluir que más del 50% de los contribuyentes consideran que el
impuesto predial es muy alto?
Intervalos de confianza para la media:
Con la distribución Z normal estándar Intervalo de confianza para la proporción
Con la distribución Z normal estándar
σ σ
[ X̄−z α
2 √n
, X̄ + z α
2 √
n ] p−z α
2
√ p ( 1− p)
n
, p+ z α
2
√ p ( 1− p)
n
Con la distribución t de student
s s
[ X̄−z α
2 √
n
, X̄ + z α
2 √
n ] [ X̄−t α
2
s
√n
, X̄ +t α
2 √
s
n ]
RUTA Calculo de tamaños ÓPTIMOS de muestra para estimar una media poblacional (μ)
& una proporción poblacional (π)
Temas:
Tamaño de muestra para la media poblacional (µ)
Tamaño de muestra para la proporción poblacional (π)
CALCULO DEL TAMAÑO DE MUESTRA
La pregunta de qué tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de
cualquier trabajo de investigación, encuesta o experimento. Tomar una muestra más grande de lo necesario para
obtener los resultados deseados es un desperdicio de recursos, mientras que, por otro lado, muestras demasiado
pequeñas con frecuencia dan resultados que carecen de uso práctico.
Aquí se estudia cómo determinar el tamaño de la muestra, según el parámetro de interés: media poblacional μ o
proporción poblacional π. El razonamiento para la determinación del tamaño de muestra n es sencillo, bastará con
conocer o determinar ciertos datos, entre ellos el error de estimación e (o margen de error o error absoluto
permisible), el valor de Z para un nivel de confianza especifico, la desviación estándar (en el caso de una media) o
la proporción π (en el caso de una proporción) y el tamaño de la población N si se suministra.
Tabla 1. Resumen de fórmulas para calcular tamaños de muestra para estimar μ y π
Caso Parámetro Población infinita Población finita
2 no
Z n
Media n /2 n
1 o
e N
n
Proporció
Z2 / 2 p (1 p ) n o
π n n
1 o
n e2 N
TALLER
1. Un proveedor de artículos para carros, afirma que estos tienen un costo mensual, el cual se distribuye normal,
con una desviación estándar de 3000 pesos por mes. Un fabricante desea estimar el costo promedio mensual de
los artículos con una confianza del 95%, utiliza un error permisible de 500 pesos ¿Cuál será el tamaño óptimo de
muestra? R/ 139
2. Con base en un estudio anterior se encontró que la proporción de estudiantes, que en un día determinado
utiliza el servicio de Internet en una Biblioteca académica es del 60%. Si se determinara un error permisible del
5% ¿Cuál sería el tamaño óptimo de muestra, con una confiabilidad del 96%, para estimar la proporción de
estudiantes que utilizan el servicio de Internet en la Biblioteca académica? y ¿Cuál será el tamaño óptimo de
muestra si son 5 mil estudiantes? R/405, 375
3. La gerencia de una empresa de producción y ventas de gaseosas, ha contratado a una empresa de mercadeo,
para que realice un estudio de cómo está su mercado, esta empresa realizó una encuesta piloto a treinta
consumidores de gaseosa, donde su variable más importante era si consumían la gaseosa de la empresa en la
actualidad. El resultado en la muestra piloto de la variable más importante, dio un consumo del 35%. Con base
en este resultado calcule el tamaño de muestra del estudio, utilizando un nivel de confiabilidad del 95% y un
error permisible del 5%. Para estimar el costo promedio, qué tamaño de muestra es el óptimo si se requiere una
confiabilidad del 98% y un error permisible de $100, sabiendo que la prueba piloto dio una desviación de $750.
R/ 350, 306
4. Una empresa que realiza estudios de control de calidad, tiene mucha experiencia en este tipo de estudios y sabe
que el llenado de gaseosas se distribuye aproximadamente normal, con una desviación estándar de 5 mililitros.
Con un 96% de confiabilidad, qué tamaño óptimo de muestra se debe obtener, para estimar el promedio de
llenado de las gaseosas, sí se asume un error permisible de 1 mililitro. R/ 106
5. Un almacén de cadena, que comercializa toda clase de ropa y su mercado según estudios anteriores es del 38%
de la población, si usted utiliza un nivel de confianza del 95% y un error permisible de muestreo del 5%, ¿qué
tamaño de muestra óptimo requiere, para estimar el mercado actual? R/ 362
6. En un estudio del DANE sobre rotación de empleo se tiene la siguiente información sobre los Administradores
en cierta ciudad: hay aproximadamente 12000 Administradores activos, la proporción de Administradores que
han cambiado de empresa en los últimos tres años es del 21%,
a) Para actualizar el estudio, cuántas hojas de vida de Administradores se deben estudiar si requiere una un error
del 5% y un nivel de confianza del 98%?
b) ¿A cuántos Administradores se deben contactar si no están disponibles estimadores anteriores de la proporción
de la población? Use la precisión y la confianza del ítem a).
7. Una empresa constructora desea estimar, con un nivel de confianza del 95% y un error de estimación de 0.025,
la proporción de personas de una determinada ciudad que comprarían vivienda de dimensiones comprendidas
entre 180 y 200 m2. Para ello pretende tomar una muestra aleatoria simple entre los potenciales compradores
de vivienda, disponiendo para realizar el muestreo de $ 10’000000.
a) Si cada elemento muestreado supone un coste de $10000 ¿Es suficiente el presupuesto disponible?
b) ¿Qué nivel de confianza se puede alcanzar con $10’000000 de presupuesto (para n=1000) si se pretende
mantener el error de estimación en 0.025?
8. Un investigador desea estimar el salario medio por hora (medido en miles de pesos) en un determinado sector.
En concreto, pretende determinar un intervalo de confianza del 95% y un error de 10 para dicho salario medio.
Debido a estudios anteriormente realizados, está dispuesto a aceptar que los salarios siguen una distribución
normal con varianza 650 ¿Qué tamaño de muestra deberá utilizar?
9. Una conocida empresa bancaria de tarjetas de crédito tiene interés en estimar la proporción de tarjeta bientes
cuyo saldo es distinto de cero a final del mes, e incurren en intereses. Suponga que el margen de error deseado
es de 0.03 con un nivel de confianza de 98%.
a) ¿De qué tamaño de debe seleccionar una muestra si se cree que, más o menos, el 70% de los clientes llegan
con un saldo distinto a cero al final del mes?
b) ¿De qué tamaño se debe seleccionar una muestra si no sé puede especificar un valor de planeación para la
proporción poblacional?
10. Muchos colombianos que trabajan en grandes oficinas también trabajan en casa o en sus oficinas durante los
fines de semana ¿De qué tamaño de ser una muestra para estimar la media de la población del tiempo que se
trabaja en los fines de semana, con un margen de error de 10 minutos? Emplee un nivel de significancia de 0.05
y suponga que el valor de la desviación estándar poblacional es de 45 minutos.
11. Para determinado modelo de automóvil se llevan a cabo pruebas de rendimiento de gasolina. Si la precisión que
se desea es un intervalo de confianza del 98% con un margen de error de 1,5 Km. por galón ¿Cuantos
automóviles deben participar en la prueba? Suponga que las pruebas preliminares de rendimiento indican que
la desviación estándar es de 4,2 Km. por galón.
12. En una revista nacional se menciona el porcentaje de personas de 18 años y mayores que fuman. Suponga que
un estudio se diseña para reunir nuevos datos de fumadores y no fumadores. La mejor estimación preliminar de
la proporción poblacional de quienes fuman es del 30%.
a) ¿De qué tamaño debe tomarse una muestra para estimar la proporción de fumadores en la población con
un margen de error igual a 2%? Utilice un nivel de confianza del 0.95
b) Suponga que el estudio usa una recomendación de tamaño de muestra del literal a) y ve que hay 520
fumadores ¿Cuál es la estimación puntual de la proporción de fumadores en la población?
13. Al determinar la programación de las citas con pacientes, un centro médico desea una estimación de la media
del tiempo que pasa un médico con cada paciente. ¿De qué tamaño se debe tomar una muestra para que el
margen de error deseado sea de 2 minutos con un nivel de confianza del 95%? ¿De qué tamaño debe ser la
muestra para tener un nivel de confianza del 99%? Emplee una desviación estándar de 8 minutos.
14. En una encuesta para las elecciones políticas se muestreó a 491 posibles votantes en el mes de junio. Uno de los
principales objetivos de la encuesta fue obtener una estimación de la proporción de posibles votantes a favor de
cada candidato. Suponga que un valor de planificación para la proporción poblacional de π=0.50 y un nivel de
confianza del 95%.
a) Con π=0.50 ¿Cuál fue el margen de error planeado para la encuesta de junio?
b) A medida que se acercaban las elecciones en noviembre, se deseaba mejor precisión y márgenes de error
más pequeños. Suponga que se solicitaron los siguientes márgenes de error para las encuestas que se
llevaran a cabo durante la campaña presidencial. Calcule el tamaño de muestra recomendado para cada
encuesta.
Encuesta Margen de error
Septiembre 0.04
Octubre 0.03
Principios de noviembre 0.02
Día previo a la elección 0.01