Estadistica 2024
Estadistica 2024
Bibliografía
Estadística inferencial
Procesamiento de datos
El núcleo de la estadística son los datos, estos son cantidades o medidas que han
sido obtenidas como resultado de las observaciones. Los datos se obtienen mediante
cuestionarios llamados encuestas, diseñados de tal forma que permitan luego un fácil
manejo para conteo y organización de los mismos. La organización y presentación de los
datos se conoce con el nombre de procesamiento de datos que transforman los datos en
información.
Edades Frecu
20 0
21 3
23 1
19 3
24 1
31 1
Población
Es el conjunto total de personas, cosas o animales sobre el cual se plantea un estudio
Muestra
Es un subconjunto o parte de la población, formada por los individuos seleccionados
de ella para analizar en el estudio
Individuo
Se llama individuo a cada uno de los elementos que componen la población
estadística, es cualquier ente observable (personas, cualquier ser vivo, objetos, incluso algo
abstracto).
Variables estadísticas
Es cada una de las características, cualidades, rasgos de los individuos o elementos
de una población que pueden ser estudiados. Las variables estadísticas se clasifican en:
• Variables cualitativas: son las que expresan cualidades o aspectos que no
pueden ser valorados numéricamente, como ser; sexo, cutis, color de pelo… etc
• Variables cuantitativas: son las que expresan cualidades o aspectos que
pueden ser valorados numéricamente, como ser; peso, edad, estatura… etc. Las
variables cuantitativas se clasifican en:
a) Variables cuantitativas discretas: son aquellas que pueden ser contadas mediante
números entero, dado que el uso de números no enteros no tendría sentido.
Ejemplos: cantidad de hijos, numero de hermanos… etc
b) Variables cuantitativas continuas: son aquellas variables que pueden ser medidas
usando números enteros o decimales. Ejemplos: peso, estatura… etc
Actividades
b) Se hizo un estudio entre 300 amas de casa de la ciudad de Fernando de la Mora sobre la
calidad de cierta marca de jabón de tocador
Población:
Muestra:
Variable:
c) Se midió y se pesó a un grupo de 700 chicos de 18 años de la Ciudad de Lambaré y Villa
Elisa para determinar la estatura y peso promedio de los mismos.
Población:
Muestra:
Variable:
3) Realizo mapa conceptual referente a la variable estadística
Muestreo
Muestreo “Es un procedimiento estadístico que nos permite recolectar una muestra
de una población, de la cual se pueden realizar inferencias basadas en las características de
la muestra. Esta herramienta es comúnmente utilizada para realizar estudios, de las
características generales de un problema o situación basándose, en la selección de una
parte, del conjunto total de la población o universo en estudio. Según algunos autores se
define el muestreo de la siguiente manera: El termino muestra es el procedimiento
mediante el cual obtenemos una muestra representativa de una población”. (Salama;2003).
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a
la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos
a los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio
adecuado que consienta no solo hacer estimaciones de la población sino estimar también
los márgenes de error correspondientes a dichas estimaciones, debe cumplir ciertos
requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra
representativa, pero sí podemos actuar de manera que esta condición se alcance con una
probabilidad alta.
Unidad de observación
Es el objeto sobre el cual se realiza una medición. Esta es la unidad básica de
observación, a veces llamado elemento. En los estudios de poblaciones humanas, con
frecuencia ocurre que las unidades de observación son los individuos. (Sharon;2000)
Población objetivo
Población muestreada
Marco de muestreo
Marco insuficiente: Esto significa que el marco no abarca algunos elementos que
forman la población definida para el estudio. Desde luego, tales elementos no tienen
ninguna posibilidad de parecer en la muestra y quedaran sub representadas si la omisión es
parcial, y no representadas si la omisión es total. (Sharon; 2000)
Duplicaciones: Algunos marcos pueden incluir más de una vez algunas unidades.
En la medida que tales duplicaciones no puedan ser detectadas oportunamente, se producirá
también un sesgo en los resultados.
Marco anticuado: Es posible que el marco no esté actualizado, por lo cual puede
contener unidades que ya no pertenecen al universo de estudio. Ocurres cuando se trabaja
con información secundaria desactualizada.
Elementos ajenos: Un marco puede contener unidades que no pertenecen al
universo de estudio.
En la mayoría de las aplicaciones para las que se edificó esta teoría, el conjunto del
que se desea obtener información es finito y bien delimitado, como sería por ejemplo el
conjunto de habitantes de una ciudad, las máquinas de una fábrica o los peces de un lago.
(Sharon; 2000)
• Si los datos se obtienen únicamente de una pequeña fracción del total, los gastos
son menores que los que se realizarán si se lleva a cabo un censo completo.
• Por la misma razón, los datos pueden ser recolectados y resumidos más rápidamente
con una muestra que con una enumeración completa.
• Debido a que al reducir el volumen de trabajo se puede emplear personal más
capacitado y someterlo a un entrenamiento intensivo y debido también a que en
estas condiciones será factible la supervisión cuidadosa del trabajo de campo y del
procesamiento de los resultados, una muestra puede producir resultados más
exactos que la enumeración completa.
Al planear una encuesta por muestreo, siempre se alcanza una etapa en donde hay
que tomar una decisión respecto al tamaño de la muestra. Esta decisión es importante. Una
muestra demasiado grande implica un despilfarro de recursos y una muy pequeña
disminuye la utilidad de los resultados. La decisión no siempre puede tomarse
satisfactoriamente; a menudo no disponemos de la suficiente información para saber si el
tamaño de la muestra seleccionada, es el óptimo. La teoría del muestreo proporciona un
marco dentro del cual se puede pensar inteligentemente respecto a este problema. (Sharon;
2000)
• Importancia de la decisión.
• Naturaleza de la investigación.
• Número de variables.
• Naturaleza del análisis.
• Tamaños de muestra utilizados en estudios similares.
• Restricciones de recursos.
Se establece que, para el cálculo de una muestra depende de tres factores, “el
primero se refiere al porcentaje de confianza con que se desea generalizar los datos,
segundo; el porcentaje de error que se está dispuesto a aceptar en tal generalización y
tercero, el nivel de variabilidad que se calcula para la comprobación de la hipótesis”.
(Castañeda et al.; 2006). Además, establece dos fórmulas para el cálculo de una muestra,
sea esta para poblaciones finitas e infinitas.
Z 2 . p.q
Población finita n =
e2
Z 2 . p.q.N
Población infinita n =
Ne 2 + Z 2 pq
La Especificación de la Precisión.
Tipos de muestreos.
Muestreo probabilístico
Muestreo sistemático
Muestreo estratificado
Se considera que “en este tipo de muestreo hay que asegurarse de incluir algunos
elementos de la población en la muestra. La población de un muestreo por cuota se haría
de tal manera que se respetaría esta distribución en la muestra”. Busca a veces construir una
muestra representativa de una población controlando las características de las unidades de
muestreos seleccionados. De esta manera, la distribución de esas características en la
muestra coincide con lo que se observa en la población. (Sanabria, et al; 2003)
Muestreo intencional
Las ventajas del muestreo por conveniencia es que menos costosa y se puede
realizar en el menor tiempo, ya que las unidades de las unidades de muestreo es accesibles,
fáciles de medir y cooperativas.
Bola de nieve
El muestreo por juicio es “una forma de muestreo por conveniencia en que los
elementos de la población se seleccionan con base en el juicio del investigador, el cual,
empleando su juicio o experiencia, elige a los elementos que se incluirán en la muestra
porque cree que son representativos de la población de interés o que son apropiados en
alguna forma” (Naresh; 2004)
Tabla de frecuencia
Los datos que se organizan en tablas de frecuencias con la finalidad de sintetizar la
información que ellos contengan, permitiendo una primera interpretación de los hechos en
estudio.
Frecuencia absoluta: es la cantidad de veces que se repite cada valor de la variable. La
suma de todas las frecuencias absolutas da el número total de datos.
Frecuencia acumulada: es la que informa del número de datos que se hallan hasta un
determinado dato. Es el resultado que se obtiene al sumar la frecuencia absoluta del mismo
y las anteriores a él.
Frecuencia relativa: es el cociente entre la frecuencia absoluta de cada valor de la variable
y el número total de datos. La suma de todas las frecuencias relativa da uno.
Frecuencia porcentual: es la que se obtiene multiplicando por cien la frecuencia relativa.
La suma de la frecuencia porcentual da 100.
Tipos de datos.
Datos agrupados: son aquellos que se agrupan y se distribuyen en grupos o categorías
(clases) de dos más valores cuando se dispone de una gran cantidad de datos (n mayores a
30)
Datos simples o no agrupados: cuando los datos observados no constituyen un grupo o
tamaño, cuando se tiene datos poco numerosos (n menores a 30)
Ejercicios
1) Las calificaciones en estadística de un grupo de estudiantes de cierta universidad se
observa a continuación
1 2 4 5 1 2 3 4 5 1 1 2 1
2 1 4 1 1 1 2 3 1 2 3 3 4
1 2 3 4 5 1 2 2 2 2 1 2 4
4 1 2 1 5 4 1 2 1 1 1 3 3
Gráficos de barras
Es un gráfico en el cual se coloca la variable sobre uno de los ejes y las frecuencias sobre
el otro eje o viceversa, trazando rectángulos separados sobre los valores de la variable y con
alturas que coinciden con la frecuencia absoluta.
Grafico circular
Consiste en dividir un círculo en sectores circulares, de forma que cada sector represente
uno de los valores de la variable y cuyo ángulo sea proporcional a su correspondiente
frecuencia. Se usa para expresar gráficamente la proporción o porcentaje en que aparece
cada valor de la variable con respecto al total. Se obtiene al multiplicar la frecuencia
relativa por 360.
Grafico lineal
Son también denominados de tendencias. Se utiliza generalmente para analizar la
evolución de una variable en el tiempo. Sobre el eje de las abscisas se coloca la variable
(tiempo) y sobre el eje de las ordenadas, las frecuencias. Se forman uniendo, mediante una
línea poligonal, los puntos que indican las frecuencias absolutas observadas.
Histograma
Es el grafico de barras que se utiliza para representar variables cuantitativas continuas
agrupadas en intervalos, con la diferencia de que los rectángulos están unidos a otros,
justamente porque se trata de variables continuas que se cuantifican con números
decimales.
Polígonos de frecuencias
El polígono de frecuencia es un gráfico lineal que se obtiene uniendo los puntos medios de
las barras superiores de los rectángulos del histograma correspondiente.
Ejercicios
1. Las informaciones se refieren al comportamiento del tiempo en un periodo de un
mes. Soleado 12 días, sol y nubes 9 días, nublado 5 días, lluvia 4 días. Con estos
datos construyo un una tabla de frecuencia y un gráfico de barra.
2. En una caja hay 36 lápices de colores de los cuales, 11 son rojas, 4 azules, 8 verdes
y 10 amarillas y 3 marrones. Con estos datos construya una tabla de frecuencia y
un gráfico de barra.
3. Realiza un diagrama de sectores para los siguientes datos, color de pelo: moreno
124, castaño 214, rubio 315, pelirrojo 53.
4. Construya un gráfico circular sobre las preferencias de votantes para una
determinada elección, candidato A 153 votos, candidato B 35 votos, candidato C
112 votos.
5. Construya un gráfico lineal para la información que se presenta a continuación
Días
Temperatura Domingo Lunes Martes Miércoles Jueves Viernes Sábado
Máxima 16 15 17 19 18 23 27
Mínima 11 10 9 12 7 8 21
6. Los datos de abajo representa lluvias caídas en una determinada zona, realizar un
gráfico lineal
Meses 01 02 03 04 05 06 07 08 09 10 11 12
Lluvias 26 18 17 15 20 10 12 10 15 22 27 40
Dispersión
Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.
Ejemplo Desviación típica, varianza
Rango: es la diferencia entre el máximo y el mínimo
1. Media
1.1. MEDIA ARITMÉTICA: Es el promedio más comúnmente usado, la media aritmética está
x i
dada por la formula x = y que significa: la suma de todos los valores dividida por el
N
número de datos.
x + x 2 + x3 + ........ + x n
x i
x= 1 =
N N
1.2.Media aritmética ponderada: a veces se asocia a los números X1, X2, … Xk
ciertos factores o pesos W1, W2… Wk que dependen de la significación o
importancia de cada uno de los números, en este caso
wX i
W1 X 1 + W2 X 2 + .... + Wk X k
x= =
w W1 + W2 + .... + Wk
1.3.Media Geométrica: la media geométrica G de una serie de N números X1, X2, …
Xn es la raíz n – esima del producto de los números:
G = n X 1 . X 2 .... X n
1.4.Media Armónica: la media armónica H de una serie de N números X1, X2, …
Xn es la reciproca de la media aritmética de los recíprocos de los números
1 N
H= =
xi xi
N
2. MEDIANA ( el valor central o el que representa el 50 % de los datos)
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de
la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces
la mediana se obtendrá sacando el promedio de ellos
La mediana toma en cuenta la posición de los datos y se define como el valor central de una serie de
datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son
menores que el y no más de la mitad mayores.
x1 x 2 x 3 x 4 x 5 x 6 x 7 x1 x 2 x 3 x 4 x 5 x 6
La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere
fácilmente: es la altura más corriente, es la velocidad más común, etc. Además tiene la ventaja de
que no se ve afectada por la presencia de valores altos o bajos. La moda es utilizada generalmente
cuando se presentan variables cualitativas.
=
(x1 − x)2 + (x2 − x)2 + (x3 − x)2 + ........ + (xn − x)2 =
N
Ejercicios
1) La siguiente tabla indica las alturas redondeadas en pulgadas (in) una muestra de 7
estudiantes varones.
Altura (X) 70 63 72 60 66 70 74
FX Referencias
X = media
Media X =
N F = Frecuencia absoluta
X = marca de clase
N
− fi N = número total de datos
Mediana Med = Li + 2 .C Li = limite real inferior de la clase mediana o modal
fmed Σfi= suma de todas las frecuencias por encima de la mediana
Fmed = frecuencia absoluta de la clase mediana
C = tamaño o anchura de cada intervalo de clase
1 Δ1 = exceso de la frecuencia modal por encima de la frecuencia
Moda Mod = Li + .C
1 + 2
absoluta
Δ2 = exceso de la frecuencia modal por debajo de la frecuencia
Desviación típica =
fX 2
−X
2
absoluta
Ejercicios
1) En la tabla se registra la altura de 40 estudiantes varones de la universidad “XYZ”, las
alturas de los estudiantes fueron tomadas en centímetros.
Estaturas en cm Frecuencias X
149 – 153 2
154 – 158 4
159 - 163 11
164 – 168 14
169 – 173 5
174 – 178 4
Total
Calcular: a) La media b) La mediana c) La moda d) desviación típica
Estaturas en cm Frecuencias X
0–8 13
9 – 17 35
18 - 26 38
27 – 35 47
36 – 44 44
45 – 53 8
54 – 62 5
Total
Intervalos Frecuencia
de clase
8 - 14 13
15 – 21 10
22 – 28 16
29 – 35 11
36 – 42 6
43 – 49 4
Total
Calcula:
a) Media b) Mediana c) Moda d) Desviación típica e) Histograma y polígono
de frecuencia
Probabilidad
Enfoque Clásico
𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑛
𝑝= =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑁
El enfoque subjetivo
Eventos Independientes
Probabilidad condicional
No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el
tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o
pueden no tener relación causal. Las relaciones causales o temporales son nociones que no
pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de
la interpretación que se le dé a los eventos.
Un ejemplo clásico es el lanzamiento de una moneda para luego lanzar un dado. ¿Cuál es la
probabilidad que en el dado salga un 6 dado que ya haya salido una cara en la moneda?
Esta probabilidad se denota de esta manera: P(6|C).
1) Una caja contiene 11 boletos enumerados del 1 al 11. Si se extrae al azar uno por vez, halla la
probabilidad de que sea:
5 6 4
a) Un número par R= b) Un número impar R= c) Menor que cinco. R=
11 11 11
2) Un ropero contiene 8 remeras rojas, 6 remeras azules y 4 blancas, cual es probabilidad de
elegir:
1 5
a) Una remera azul. R= b) Una remera azul o blanca. R= c) Una remera no
3 9
2
azul. R =
3
2
d) Dos remeras, una azul y otra blanca. R= e) Dos remeras, una roja y otra blanca
27
8
R=
81
3) Se confecciona una bandera con tres franjas horizontales de diferentes colores: rojo, blanco y
azul. Calcular la probabilidad de:
1
a) que se forme la bandera paraguaya R= b) que el azul quede en la franja de abajo
6
1
R=
3
4) Una caja contiene 7 bolas, de las cuales 5 son blancas y 2 azules. Cual es la probabilidad de
que sacando al azar sin reposición, dos bolas ( una después de la otra)
5
a) el primero sea blanco y el segundo azul. R= b) el primero sea blanco y el
21
10
segundo sea blanco. R =
21
5) Cuál es la probabilidad de que una pareja tenga tres hijos:
1 7
a) Del mismo sexo. R= b) Por lo menos un hombre R= c) Una mujer. R=
4 8
3
8
Probabilidad Condicional
3
a) Cual es la probabilidad que el votante se oponga al plan, dado que pertenece PLRA. R =
7
P(OP/PLRA) =60/140 = 3/7
b) Cual es la probabilidad de que el votante sea de la ANR, sabiendo que se opone al plan.
1
R=
6
P(ANR/OP) =20/120 = 1/6
10) Una muestra aleatoria de 200 adultos se clasifica abajo por sexo y su nivel de educación.
11) Un experimento para estudiar la relación de la hipertensión arterial y los hábitos de fumar, se
reúnen en los siguientes datos para 180 individuos.
12) En una empresa hay 45 empleados, 29 hombres (H) y 16 mujeres (M); de ellos, 7 hombres y 5
mujeres son fumadores (F).
H M T
F 7 5 12
NF 22 11 33
T 29 16 45
Distribución Binomial
• En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su
contrario 𝐴̅ (fracaso).
• El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
• La probabilidad del suceso A es constante, la representamos por p, y no varía de una
prueba a otra. La probabilidad de 𝐴̅ es 1- p y la representamos por q.
• El experimento consta de un número n de pruebas.
Todo experimento que tenga estas características diremos que sigue el modelo de la distribución
Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del
experimento, la llamaremos variable aleatoria binomial.
𝑃(𝑋) = 𝑛 𝐶 𝑥 . 𝑝 𝑥 . 𝑞 𝑛−𝑥
𝒏 = 𝑁º 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠 𝑝𝑟𝑎𝑐𝑡𝑖𝑐𝑎𝑑𝑜𝑠.
𝒙 = 𝑁º 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠 𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜𝑠 𝑒𝑛 𝒏 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝒑 = 𝐿𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝒒 = 1 − 𝑝 𝑒𝑠 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜.
15
1) La probabilidad de obtener 2 caras en 6 lanzamientos de una moneda. R =
64
2) Encuentre la probabilidad de que una familia de 4 hijos haya tenido, al menos un varón. R=
15
16
3) Un cazador mata patos atina al blanco el 40% de las veces, si hoy le disparo a 12 patos,
calcular la probabilidad de que haya fallado 3 veces. R = 0,01246
4) Celeste violeta amarilla de rojas es la alumna más distinguida del salón tiene probabilidad
del 40% de reprobar la materia, calcular la probabilidad de que apruebe 3 de los 5
exámenes parciales. R =0,3456
5) Un prominente medico afirma que el 70 % de las personas con cáncer de pulmón son
fumadores empedernidos, si su aseveración es correcta. Encuentre la probabilidad de que
de 10 de tales pacientes admitidos recientemente en hospital, menos de la mitad sean
fumadores empedernidos. R =0,0474
6) La probabilidad de que una persona se recupere de una enfermedad sanguínea es del
40%. Si sabe que 15 personas contraen esta enfermedad. Cuál es la probabilidad de que:
a) Sobrevivan al menos 1 pacientes. R= 0,033833 b) Sobrevivan de 3 a 4 pacientes.
Distribución de Poisson
𝜆𝑥 . 𝑒 −𝜆
𝑃 (𝑥 ) =
𝑥!
𝒏 = 𝑁º 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠 𝑝𝑟𝑎𝑐𝑡𝑖𝑐𝑎𝑑𝑜𝑠
𝒙 = 𝑁º 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠 𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜𝑠 𝑒𝑛 𝒏 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝝀 = 𝐸𝑠 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜. (𝝀 = 𝒏. 𝒑)
𝒆 = 2,71828 ….
1) En el interior del país, como promedio mueren 2 vacas mensualmente electrocutadas por
rayos. Indicar la probabilidad de que en un mes determinado mueran 4 vacas (suponer
que no hay influencia estacional o geográfica en la posible cantidad de accidentes). R =
0,09
Datos
Lamda =
X=4
P(x =4) = 24e -2/(4!) =
Distribución normal
X −
Z=
−
X = media muestral
u = media poblacional
= desviación típica
Ejercicios
1) Se supone que los resultados de un examen siguen una distribución normal con media 78
y desviación típica 6. Se pide:
a) ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una
calificación menor a 72?
b) ¿Cuál es la probabilidad que la calificación sea mayor a 82?
c) ¿Cuál es la probabilidad sea igual a 74??
d) ¿Cuál es la probabilidad de que tenga puntuación entre 70 y 85?
4) Varios test de inteligencia dieron una puntuación que sigue una ley normal con media
100 y desviación típica 15: a) Determinar el porcentaje de población que obtendría un
coeficiente entre 95 y 110. b) Porcentaje de población que tendría un coeficiente mayor a
115 c) En una población de 2500 individuos ¿cuántos individuos se esperan que tengan un
coeficiente superior a 125?
Prueba de hipótesis
Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos
de problemas de toma de decisiones, pruebas o experimentos en el mundo, pueden
formularse como problemas de prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera.
También es conocido como ó nivel de significancía.
El error tipo II ó error se define como la aceptación de la hipótesis nula cuando ésta es
falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que
determinan si la decisión final es correcta o errónea.
Tipos de Ensayo
• Unilateral Derecho
• Unilateral Izquierdo
• Bilateral
Ensayo de hipótesis:
Ho; Parámetro u =
H1; Parámetro u x
• Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en
el parámetro, en este caso el nivel de significancía se carga todo hacia el lado izquierdo,
para definir las regiones de aceptación y de rechazo.
Ensayo de hipótesis:
Ho; Parámetro u =
H1; Parámetro x
Ensayo de hipótesis:
Ho; Parámetro = x
H1; Parámetro x
Observaciones:
*En donde dice parámetro (se refiere a media (u) o porcentaje (p)
*Por más de que el resultado de la muestra sea menor o mayor, y la pregunta dice ha cambiado se
debe usar el de dos colas (bilaterales)
Tabla de valores de Zt (zeta tabulada) – Prueba de Hipótesis
Nivel de
significancia
0,10 0,05 0,01 0,005 0,002
Valores para Zt
para pruebas de
-1,28 o 1,28 -1,645 o -2,33 o 2,33 -2,58 o 2,58 -2, 88 o 2,88
una cola
1,645
Valores para Zt
para pruebas de
-1,645 o -1,96 o 1,96 -2,58 o 2,58 -2,81 o 2,81 -3,08 o 3,08
dos cola
1,645
Ejemplos:
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional
de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años?
Utilice un nivel de significancia de 0.05.
5) Regla de decisión
6) Conclusión: como Zc = 2,02 mayor al valor de Zt = 1,645, se rechaza la hipótesis nula (Ho), lo
que implica que el promedio de vida ha sido mayor que 70 años.
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha disminuido?
Utilice un nivel de significancia del 0.002.
Z c = −1,643
5) Regla de decisión
1) Se acepta Ho: si Zc ≥ Zt
2) Se rechaza Ho: si Zc < Zt
6) Conclusión
Como el valor de Zc = -1,645 mayor a Zt = -2,88, se acepta Ho, es decir, el promedio de
duración de los focos son aproximadamente 800 horas.
3) Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que
se construyen hoy en día en la ciudad de Richmond. Puede usted estar de acuerdo con
esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15
tienen instaladas bombas de calor. Utilice un nivel de significancia de 0.10.
Z c = −1,43
5) Regla de decisión
1) Se acepta Ho: si Zc ≥ Zt
2) Se rechaza Ho: si Zc < Zt
0,1
Zt=-1,28
P =0,7
6) Regla de decision
Como Zc = -1,43 menor a Zt = -1,28, se rechaza Ho, es decir el porcentaje ha sido menor al 70%.
Ejercicios
1. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 40 focos tiene una duración promedio de 815 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha aumentado.
Utilice un nivel de significancia del 0,1.
2. La resistencia al rompimiento de los cable producidos por un fabricante tiene media de
1600 lb y desviación estándar de 90 lb. Se afirma que con la implementación de una
técnica nueva en el proceso se ve disminuida dicha resistencia. Para probar esta
afirmación se probó una muestra de 64 cables y se encontró que la resistencia al
rompimiento es de 1550 lb. Podemos apoyar la afirmación con un nivel de significancia de
0,01.
3. En el pasado una maquina produjo empaques cuyo grosor medio era 0,050 cm. Para
determinar si la maquina estaba trabajando correctamente se tomó una muestra de 10
empaques, para el cual el grosor promedio era de 0, 053 cm y su desviación estándar era
0,003. Pruebe la hipótesis de que la maquina estaba trabajando adecuadamente utilizando
un nivel de significancia de 0,05.
4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación
si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia de 0.10.
5. El fabricante de un medicamento patentado sostiene que tiene una eficacia del 90 % en
aliviar cierta alergia durante un periodo de 8 horas. en una muestra de 200 personas con
dicha alergia, el medicamento mejoro a 160 personas. determine si la afirmación del
fabricante es verídica utilizando un nivel de significancia de 0,01.