[go: up one dir, main page]

100% encontró este documento útil (1 voto)
3K vistas16 páginas

Concepto de Estimación

Este documento describe diferentes conceptos relacionados con la estimación estadística. Define la estimación como el proceso de aproximar valores desconocidos de parámetros poblacionales a partir de datos muestrales. Explica que las estimaciones pueden ser puntuales, que proporcionan un solo valor, o por intervalos, que proveen un rango de valores. También cubre conceptos como niveles de confianza e introduce fórmulas para calcular intervalos de confianza para la media y la proporción.

Cargado por

Freddy Guerrero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
3K vistas16 páginas

Concepto de Estimación

Este documento describe diferentes conceptos relacionados con la estimación estadística. Define la estimación como el proceso de aproximar valores desconocidos de parámetros poblacionales a partir de datos muestrales. Explica que las estimaciones pueden ser puntuales, que proporcionan un solo valor, o por intervalos, que proveen un rango de valores. También cubre conceptos como niveles de confianza e introduce fórmulas para calcular intervalos de confianza para la media y la proporción.

Cargado por

Freddy Guerrero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 16

Concepto de Estimación

Se define como estimar que algo va a ocurrir respecto a algo (o que esta ocurriendo, o
que ocurrió), a pesar de ser un elemento muy claramente estadístico, esta muy enraizado en
nuestra cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo de
posibilidades.

El conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una


población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación
de la media de una determinada característica de una población de tamaño N podría ser la
media de esa misma característica para una muestra de tamaño N.

Estimaciones Puntuales y de Intervalos

Estimación Puntual

La estimación de parámetros tiene por resultado un solo punto. Consiste en un solo


estadístico muestral que se usa para estimar el valor verdadero de un parámetro de una
población que es desconocido. Por ejemplo, la medida muestral X es un estimador puntual de la
medida poblacional μ.

Cuando usamos una estimación puntual, sabemos que, aunque usemos un método
bueno de estimación es prácticamente improbable que el valor de la estimación coincida con el
verdadero valor del parámetro, así que seria conveniente acompañar nuestra estimación con
alguna medida que nos permitiera expresar la cercanía del estimador al parámetro.

Una solución a ello no los brinda los estimadores por intervalos de confianza.

Una estimación es puntual cuando se usa un solo valor extraído de la muestra para
estimar el parámetro desconocido de la población. Al valor usado de le llama estimador.

La media de la población se puede estimar puntualmente mediante la media de la


muestra:

La proporción de la población se puede estimar puntualmente mediante la proporción


de la muestra:

La desviación típica de la población se puede estimar puntualmente mediante la


desviación típica de la muestra, aunque hay mejores estimadores:
Estimación por intervalos

Es la estimación de un parámetro de la población dado por dos números entre los cuales
se puede considerar que se encuentra el parámetro. Las estimaciones de intervalo indican la
precisión de una estimación y son, por lo tanto, preferibles a las estimaciones puntuales.

A veces es conveniente obtener unos limites entre los cuales se encuentre el parámetro
con un cierto nivel de confianza, en este caso hablamos de estimación por intervalos.

Una estimación por intervalos es un rango, generalmente de ancho finito, que se espera
que contenga el parámetro.

Nivel de confianza

El nivel de confianza, C, indica, en porcentaje, con qué proporción el intervalo de


confianza contiene el parámetro estimado. El coeficiente de confianza, C, es la misma
C
proporción en tanto por uno, C= . En otras palabras, C es la probabilidad de que el
100
intervalo de confianza contenga el parámetro estimado.

Si α = 1 - c, y (a, b) es el intervalo de confianza se cumplirá.

Estimación del intervalo de confianza de la media (desviación estándar conocida


y desviación estándar desconocida).

Un intervalo de confianza intervalo de confianza se calcula siempre seleccionando


primero un nivel de confianza nivel de confianza, que es una medida del grado de confiabilidad
en el intervalo. Entonces, en el ejemplo anterior, si queremos un nivel de confianza de 95%
diríamos que es posible tener cualquier valor de m entre 9162.5 y 9482.9.

Un nivel de confianza de 95% implica que 95% de las muestras daría lugar a un intervalo
que incluye m o cualquier otro parámetro que se esté estimando, y sólo 5% de las muestras
producirá un intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el
valor del parámetro que se estima está dentro del intervalo.

Si, por ejemplo, queremos tener un nivel de confianza de 95% (lo cual es muy común),
entonces usamos la distribución normal estándar y encontramos los valores que incluyen a 95%
del área.
Supongamos que la estatura de los niños de 2 años está distribuida normalmente con
una media de 90 cm y una desviación estándar de 36 cm. ¿Cuál sería la distribución muestral de
la media para una muestra de tamaño 9? Recordemos que la media de una distribución
muestral de medias es igual a μ:
μ=μx

Y el error estándar es:


σ
σ m=
√n
Para nuestro ejemplo, la distribución muestral de la media tendría una media de 90 y
una desviación estándar de 36/3 = 12. Recordemos que la desviación estándar de una
distribución muestral es igual al error estándar.

La siguiente figura muestra esta distribución en donde el área sombreada representa el


95% del total, encontrándose entre los valores de 66.48 y 113.52. Estos límites fueron
calculados añadiendo y restando 1.96 desviaciones estándar del valor de la media de 90, lo que
equivale al 95% del área bajo una curva normal estándar, es decir: 90 - (1.96 x 12) = 90 - 23.52 =
66.48 90 + (1.96 x 12) = 90 + 23.52 = 113.52
Lo que nos muestra la figura es que 95% de las medias se encontrarían a no más de
23.52 de la media de 90 (o sea a 1.96 desviaciones estándar). Ahora si consideramos la
probabilidad de que la media de una muestra aleatoria se encuentre a cierta distancia de la
media de la población, entonces podemos decir que como 95% de la distribución está a 23.5 de
90, la probabilidad de que la media de cualquier muestra esté a 23.52 de 90 es de 0.95.

Lo anterior significa que, si calculamos repetidamente la media de una muestra, y consideramos


un intervalo que vaya de - 23.52 a + 23.52, este intervalo contendrá a la media de la población 95% de
las veces. En general, podemos calcular el intervalo de confianza con la siguiente fórmula:

Notar que no es otra cosa que despejar μ de la fórmula para el valor Z de la distribución
de medias.

De esta fórmula se puede observar que tanto el tamaño de la muestra como el valor de σ se
deben conocer. Z se puede obtener de la tabla de la distribución normal a partir del nivel de confianza
establecido.

Como en muchas ocasiones se desconoce σ en esos casos lo correcto es utilizar otra distribución
para muestras (la llamada “t” de student que veremos en la siguiente sesión) si la población de donde
provienen los datos es normal.

En este caso se puede utilizar una estimación puntual de la desviación estándar de la población
por medio de la desviación estándar de la muestra, es decir (σ ~ s).
Ejemplos: 1.

Se encuentra que la concentración promedio de zinc de una muestra de 36 cereales es


de 2.6 gramos por miligramo. Encuentre los intervalos de confianza de 95% y 99% para la
concentración media de zinc en el cereal. Suponga que la desviación estándar de la población
es 0.3. Solución: La estimación puntual de μ es x = 2.6 (el valor de la media de la muestra). El
valor de z para un nivel de confianza del 95% es 1.96, por lo tanto:

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será
más amplio:

2. Los vuelos de una empresa de aviación tienen una duración bimestral aproximadamente
distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30
vuelos tiene una duración promedio de 780 horas, encuentre los intervalos de confianza de
96% para la media de la población de todos los vuelos de esta empresa.
Con un nivel de confianza del 96% se sabe que la duración media de los vuelos está
entre 765 y 795 horas.

3.El ti empo que tardan las cajeras de un supermercado en cobrar a los


clientes sigue una ley normal con media desconocida y desviación tí pica 0,5
minutos. Para una muestra aleatoria de 25 clientes se obtuvo un ti empo
medio de 5,2 minutos.

1.Calcula el intervalo de confi anza al nivel del 95% para el ti empo medio que
se tarda en cobrar a los clientes.

2.Indica el tamaño muestral necesario para esti mar dicho ti empo medio con
un el error de ± 0,5 minutos y un nivel de confi anza del 95%.

n≥4

Estimación del intervalo de confianza para la proporción

Un estimador puntual de la proporción P en un experimento binomial esta dado por la


X
estadística P= , donde X representa el número de éxitos en N pruebas.
N

X
Por tanto, la proporción de la muestra P= , se utilizara como estimador puntual del
N
parámetro P.

Si no se espera que la proporción P desconocida este demasiado cerca de 0 o 1, se


puede establecer un intervalo de confianza para P al considerar la distribución muestral de
proporciones.
Considerando el valor Z para la distribución de proporciones

Si intentamos despejar el valor de P nos encontramos con que:

Pero ¿cómo podemos encontrar P si también está del lado derecho de la ecuación? Lo
que haremos es aproximar la proporción de la población por la de la muestra, es decir sustituir
P por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 o a 1, el


procedimiento del intervalo de confianza que se establece aquí no es confiable ya que
realmente se debería emplear la distribución binomial, por tanto, no se debe utilizar. Para estar
seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5. El error de estimación será la
diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no
excederá el valor de

Ejemplos:

1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas


amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos
compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500
reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un
intervalo de confianza de 90% para la proporción de los reproductores de discos compactos
de la población que no pasarían todas las pruebas.
2.En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 95% de confianza
para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad
tienen consecuencias fatales.

Solución: n = 300 P= 60/300 = 0.20


Z (0.95) = ± 1.96
0.20 (1−0.20)
P=0.20± 1.96
√ 300

El intervalo de confianza es entonces: 0.154737 < P < 0.245263

Determinación del tamaño de la muestra para la media

¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional? La respuesta depende del error estándar de la media, si este fuera cero,
entonces se necesitaría una sola media que será igual necesariamente a la media poblacional
desconocida  , porque   = 0.

Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que


mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario
para lograr un cierto grado de precisión.

Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la

muestra, si éste incluye el total de la población, entonces   sería igual a cero. Con esto en mente,
parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra
tal que el error de estimación sea tan pequeño como queramos, para ser más preciso, dado un nivel de
confianza y un error fijo de estimación  , se puede escoger un tamaño de muestra n tal que P(
) = Nivel de confianza. Con el propósito de determinar n.  El error máximo de estimación
esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación


resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados
fraccionarios.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de
estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplo:

1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de


Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación
estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para
que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de
4 libras?

Solución:
En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95% de confianza en
que   difiere en menos de 4 libras de  .

2. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal
con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se
desea tener 96% de confianza que la media real esté dentro de 10 horas de la media
real?

Se necesita una muestra de 68 focos para estimar la media de la población y tener un


error máximo de 10 horas.

¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un


error de 5 horas?

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como
beneficio una estimación más exacta.

3. Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se desea
saber de qué tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo.

Solución:

Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula
con el factor de corrección.

Si se tiene una población finita de 300 focos sólo se tiene que extraer de la población una
muestra sin reemplazo de 56 focos para poder estimar la duración media de los focos restantes
con un error máximo de 10 horas.
Determinación del tamaño de la muestra para una proporción

Se desea saber que tan grande se requiere que sea una muestra para asegurar que el
error al estimar P sea menor que una cantidad específica  .

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el tamaño de la
muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una
idea del comportamiento de la proporción de la población y ese valor se puede sustituir en la
fórmula, pero si no se sabe nada referente a esa proporción entonces se tienen dos opciones:

 Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimación de
P. Después con el uso de la fórmula se podría determinar de forma aproximada cuántas
observaciones se necesitan para proporcionar el grado de precisión que se desea.
 Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se obtiene el
tamaño de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la


fórmula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará
es del 95% con un error de estimación de 0.30.

p n

0.10 3.84

0.20 6.82
0.30 8.96

0.40 10.24

0.50 10.67

0.60 10.24

0.70 8.96

0.80 6.82

0.90 3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la muestra
alcanza su máximo valor.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de
estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:


 

Ejemplo:

1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de


Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la
estimación de P esté dentro de 0.02?

Solución:

Se tratarán a las 500 familias como una muestra preliminar que proporciona una
estimación de p=340/500=0.68.

Por lo tanto, si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño
2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de
la proporción real por más de 0.02.

2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer
qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos
estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere una
confianza del 95% y un error máximo de estimación de 0.10?

Solución:

En este problema, se desconoce totalmente la proporción de residentes que conoce la


opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.

Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95%
la estimación tenga un error máximo de 0.10.

Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias

Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta


dado por:
En esta ecuación se nos pueden presentar dos casos:

 Los tamaños de muestra son iguales.


 Los tamaños de muestra son diferentes.

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se


despeja n ya que n1 es igual a n2.

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando
las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.

Ejemplo:

Un director de personal quiere comparar la efectividad de dos métodos de


entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje.
Se divide un número de operarios en dos grupos iguales: el primero recibe el método de
entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se
registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una
desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la
diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de
entrenamiento?
Cada grupo debe contener aproximadamente 31 empleados.

Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Proporciones

Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta


dado por:

En esta ecuación se nos pueden presentar dos casos:

 Los tamaños de muestra son iguales.


 Los tamaños de muestra son diferentes.

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se


despeja n ya que n1 es igual a n2.

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando
las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.

Ejemplo:

Una compañía de productos alimenticios contrató a una empresa de investigación de


mercadotecnia, para muestrear dos mercados, I y II, a fin de comparar las proporciones de
consumidores que prefieren la comida congelada de la compañía con los productos de sus
competidores. No hay información previa acerca de la magnitud de las proporciones P 1 y P2. Si
la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, ¿cuántos consumidores habrá que muestrear en cada mercado?

Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimación con una confianza del 95% y un error máximo de 0.04.

También podría gustarte