[go: up one dir, main page]

0% encontró este documento útil (0 votos)
45 vistas40 páginas

Estadistica 2024

Cargado por

Sandra Mancuello
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
45 vistas40 páginas

Estadistica 2024

Cargado por

Sandra Mancuello
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 40

Estadística

Bibliografía

Murray S. (1988). Estadística. Segunda Edición. Editorial Mc Graw Hil. España.


Canavos G. (1994). Probabilidad y Estadística. Métodos y Aplicaciones. Editorial
Mc Graw Hill. México.
Berenson M. (1996). Estadística Básica en Administración. Sexta Edición. Editorial
Prentice Hall. Hispanoamericana. México.
Levin J. (1999). Estadística Aplicada a las Ciencias Humanas. Editorial Rou do
Brasil. Brasil.
Estadística

Comprende un conjunto de técnicas mediante las cuales se recogen, organizan,


analizan e interpretan datos numéricos, obteniéndose conclusiones a partir de ellas.
Clasificación de la estadística.
Estadística descriptiva
Estadística descriptiva: se sustituye o reduce el conjunto de datos obtenidos por un
pequeño número de valores descriptivos, como pueden ser: el promedio, la mediana, la
media geométrica, la varianza, la desviación típica.

Estadística inferencial

La estadística inferencial es una parte de la estadística que comprende los métodos y


procedimientos que por medio de la inducción determina propiedades de una población
estadística, a partir de una parte de esta

Procesamiento de datos
El núcleo de la estadística son los datos, estos son cantidades o medidas que han
sido obtenidas como resultado de las observaciones. Los datos se obtienen mediante
cuestionarios llamados encuestas, diseñados de tal forma que permitan luego un fácil
manejo para conteo y organización de los mismos. La organización y presentación de los
datos se conoce con el nombre de procesamiento de datos que transforman los datos en
información.
Edades Frecu
20 0
21 3
23 1
19 3
24 1
31 1

Población
Es el conjunto total de personas, cosas o animales sobre el cual se plantea un estudio
Muestra
Es un subconjunto o parte de la población, formada por los individuos seleccionados
de ella para analizar en el estudio

Individuo
Se llama individuo a cada uno de los elementos que componen la población
estadística, es cualquier ente observable (personas, cualquier ser vivo, objetos, incluso algo
abstracto).

Variables estadísticas
Es cada una de las características, cualidades, rasgos de los individuos o elementos
de una población que pueden ser estudiados. Las variables estadísticas se clasifican en:
• Variables cualitativas: son las que expresan cualidades o aspectos que no
pueden ser valorados numéricamente, como ser; sexo, cutis, color de pelo… etc
• Variables cuantitativas: son las que expresan cualidades o aspectos que
pueden ser valorados numéricamente, como ser; peso, edad, estatura… etc. Las
variables cuantitativas se clasifican en:
a) Variables cuantitativas discretas: son aquellas que pueden ser contadas mediante
números entero, dado que el uso de números no enteros no tendría sentido.
Ejemplos: cantidad de hijos, numero de hermanos… etc
b) Variables cuantitativas continuas: son aquellas variables que pueden ser medidas
usando números enteros o decimales. Ejemplos: peso, estatura… etc

Escalas de medición de variables


Nominal: se caracteriza por representar las variables mediantes símbolos numéricos o
alfabéticos. Los mismos solo se utilizan para nombrar las características. No expresa orden.
Ejemplos: estado civil, sexo
Ordinal: son variables numéricas cuyos valores representan una categoría o identifican un
grupo de pertenencias contando con un orden lógico. Puede utilizarse para indicar grado,
importancia, posición, nivel o cualquier otro tipo de orden. Ejemplos: calificación, puesto
en competencia, rango de militares, nivel de escolaridad.
Intervalo: posee las características de la medición nominal y ordinal, establece distancia
entre una medida y otra, carece de cero absoluto. Ejemplo: temperatura.
Razón: incluye las características de los tres anteriores niveles de medición (nominal,
ordinal, intervalo). Determina la distancia exacta entre los intervalos de una categoría,
adicionalmente tiene un cero absoluto. Ejemplos: cantidad de hijos, ingresos.

Actividades

1) Clasifica las variables en cualitativas y cuantitativas. En caso de ser cuantitativa indicar


si es discreta o continúa:

a) Contenido de jabón en polvo en una caja…………………………………………..


b) Música favorita………………………….
c) Enfermedades más frecuente en la infancia ………………………………
d) Número de vehículos que posee una persona……………………………..
e) Cantidad de alumnos en un aula………………………………………
f) Color de cabello de un grupo de alumnos ……………………………..
g).Altura de los alumnos de un curso. …………………………………….

2) Identifica, población, muestra y variable estadística en los siguientes enunciados


a) Se encuestó a 10 alumnos de cada curso de un colegio para determinar su preferencia por
la música reggetonera o la música pop
Población:
Muestra:
Variable:

b) Se hizo un estudio entre 300 amas de casa de la ciudad de Fernando de la Mora sobre la
calidad de cierta marca de jabón de tocador
Población:
Muestra:
Variable:
c) Se midió y se pesó a un grupo de 700 chicos de 18 años de la Ciudad de Lambaré y Villa
Elisa para determinar la estatura y peso promedio de los mismos.
Población:
Muestra:
Variable:
3) Realizo mapa conceptual referente a la variable estadística

Muestreo

“El muestreo es una herramienta de la investigación científica. Su función básica es


determinar que parte de una realidad en estudio (población o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha población”. (Sharon; 2000). El error que se
comete debido al hecho de que se obtienen conclusiones sobre cierta realidad a partir de la
observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra
adecuada significa lograr una versión simplificada de la población, que reproduzca de algún
modo sus rasgos básicos.

Muestreo “Es un procedimiento estadístico que nos permite recolectar una muestra
de una población, de la cual se pueden realizar inferencias basadas en las características de
la muestra. Esta herramienta es comúnmente utilizada para realizar estudios, de las
características generales de un problema o situación basándose, en la selección de una
parte, del conjunto total de la población o universo en estudio. Según algunos autores se
define el muestreo de la siguiente manera: El termino muestra es el procedimiento
mediante el cual obtenemos una muestra representativa de una población”. (Salama;2003).

“El muestreo estadístico es un método de investigación estadística que consiste en


un conjunto de técnicas que se utilizan para seleccionar de una población determinada una
muestra que la represente, estimar las características que interesan y medir la confianza de
esas estimaciones” (Sanabria, 2003)

Las dos características intrínsecas en una buena muestra, son la aleatoriedad y la


representatividad, lo cual, es el fin de esta investigación, pudiendo lograrse al hallar un
buen diseño de muestras, apropiado para la toma de decisiones gerenciales. La aleatoriedad
depende del procedimiento para la elección de una muestra, en tanto que la
representatividad es una cuestión más compleja, pues tiene que ver con la heterogeneidad de
la población y su mezcla, de la que no se tiene un conocimiento exacto, por lo que la
representatividad de la muestra, puede ser relativa, dependiendo su credibilidad de las
observaciones parciales de una población, de la cual se cree conocer los parámetros que la
determinan. (Naresh, 2004)

Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a
la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos
a los que se alcanzarían si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio
adecuado que consienta no solo hacer estimaciones de la población sino estimar también
los márgenes de error correspondientes a dichas estimaciones, debe cumplir ciertos
requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra
representativa, pero sí podemos actuar de manera que esta condición se alcance con una
probabilidad alta.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la


población, se puede extraer dos o más muestras de la misma población. Al conjunto de
muestras que se pueden obtener de la población se denomina espacio muestral. La variable
que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución
muestral. (Sharon; 2000)

Los requisitos para una buena muestra

Unidad de observación
Es el objeto sobre el cual se realiza una medición. Esta es la unidad básica de
observación, a veces llamado elemento. En los estudios de poblaciones humanas, con
frecuencia ocurre que las unidades de observación son los individuos. (Sharon;2000)

Población objetivo

Es la colección completa de observaciones que deseamos estudiar. La definición de


la población objetivo es una parte importante, y con frecuencia difícil, del estudio. La
elección de la población objetivo afectará profundamente a las estadísticas resultantes.
(Sharon;2000)

Población muestreada

Es la colección de todas las unidades de observación posibles que podrían extraerse


en una muestra; en otras palabras, es la población de donde se extrae la muestra.

Por lo que se debe delimitar el tipo de población a investigar y definir


claramente la población de interés o población objetivo, sobre la cual se desea hacer
inferencia con base a una muestra.

Dependiendo de cómo se seleccionen los elementos de la muestra para un


estudio se tienen los siguientes tipos de población:
Población finita: cuando el número de casos o elementos es limitado
Población infinita: cuando el número de elementos o de casos es ilimitada o muy
grande para ser medido.
Muestra

Es un subconjunto de la población. Parte o cantidad pequeña de una cosa que se


considera representativa del total y que se toma o se separa de ella con ciertos métodos para
someterla a estudio, análisis o experimentación. (Sharon; 2000)

Conjunto de cosas, personas o datos elegidos al azar, que se consideran


representativos del grupo a que pertenecen y que se toman para estudiar o determinar las
características del grupo.
Muestra representativa: Es aquella que por su tamaño y características similares
a las del conjunto del que proviene, permiten hacer inferencias o generalizar los resultados
al resto de la población con un margen de error conocido.

Muestra No Representativa: Es aquella que por su tamaño, características no


representan al conjunto total de elementos de la población, y su margen de error es
desconocido.
Unidad de muestreo

Es la unidad donde realizamos la muestra. Por ejemplo, podríamos querer estudiar


las personas, pero no tenemos una lista de todos los individuos que pertenecen a la
población objetivo. En vez de esto, las familias sirven como las unidades de muestreo y
unidades de observación son los individuos que viven en una familia

Marco de muestreo

Es la lista de las unidades de muestreo. El objetivo mismo de tomar una muestra


requiere de un marco muestral apropiado, es decir, una lista, un conjunto de tarjetas, de
mapas, etc., en el cual aparezcan identificadas las personas o unidades que componen la
población del estudio. (Sharon; 2000)

Marco insuficiente: Esto significa que el marco no abarca algunos elementos que
forman la población definida para el estudio. Desde luego, tales elementos no tienen
ninguna posibilidad de parecer en la muestra y quedaran sub representadas si la omisión es
parcial, y no representadas si la omisión es total. (Sharon; 2000)

Duplicaciones: Algunos marcos pueden incluir más de una vez algunas unidades.
En la medida que tales duplicaciones no puedan ser detectadas oportunamente, se producirá
también un sesgo en los resultados.

Marco anticuado: Es posible que el marco no esté actualizado, por lo cual puede
contener unidades que ya no pertenecen al universo de estudio. Ocurres cuando se trabaja
con información secundaria desactualizada.
Elementos ajenos: Un marco puede contener unidades que no pertenecen al
universo de estudio.

El marco muestral incluye todas las unidades muestrales contenidas en la población,


es decir, una lista de unidades muestrales, y éstas son colecciones distintas de elementos de
la población.

Las Ventajas del Método por Muestreo.

En la mayoría de las aplicaciones para las que se edificó esta teoría, el conjunto del
que se desea obtener información es finito y bien delimitado, como sería por ejemplo el
conjunto de habitantes de una ciudad, las máquinas de una fábrica o los peces de un lago.
(Sharon; 2000)

A continuación se mencionarán las ventajas que se obtienen al emplear encuestas por


muestreo:

• Si los datos se obtienen únicamente de una pequeña fracción del total, los gastos
son menores que los que se realizarán si se lleva a cabo un censo completo.
• Por la misma razón, los datos pueden ser recolectados y resumidos más rápidamente
con una muestra que con una enumeración completa.
• Debido a que al reducir el volumen de trabajo se puede emplear personal más
capacitado y someterlo a un entrenamiento intensivo y debido también a que en
estas condiciones será factible la supervisión cuidadosa del trabajo de campo y del
procesamiento de los resultados, una muestra puede producir resultados más
exactos que la enumeración completa.

La estimación del Tamaño de la Muestra.

Al planear una encuesta por muestreo, siempre se alcanza una etapa en donde hay
que tomar una decisión respecto al tamaño de la muestra. Esta decisión es importante. Una
muestra demasiado grande implica un despilfarro de recursos y una muy pequeña
disminuye la utilidad de los resultados. La decisión no siempre puede tomarse
satisfactoriamente; a menudo no disponemos de la suficiente información para saber si el
tamaño de la muestra seleccionada, es el óptimo. La teoría del muestreo proporciona un
marco dentro del cual se puede pensar inteligentemente respecto a este problema. (Sharon;
2000)

Las poblaciones son comúnmente diferentes y por lo tanto, deberán utilizarse


criterios distintos para seleccionar las unidades que conforman la muestra, según los
objetivos trazados del estudio y sus requerimientos.

Definir el tamaño de la muestra y el método de selección de las unidades de


análisis, es tal vez, el punto más crucial en el proceso investigativo, porque dependiendo
de estos, será posible generar inferencias o generalizaciones a toda la población, y por
consiguiente, influir en las expectativas de los usuarios de la información; y en el caso de
las decisiones gerenciales, les permite a las empresas definir políticas y tomar dediciones
con un buen sustento estadístico.

Para determinar el tamaño de la muestra, se deben considerar los siguientes


factores cualitativos:

• Importancia de la decisión.
• Naturaleza de la investigación.
• Número de variables.
• Naturaleza del análisis.
• Tamaños de muestra utilizados en estudios similares.
• Restricciones de recursos.

El tamaño de la población es una variable que no se puede controlar, sin embargo,


el tamaño de la muestra está bajo el control del investigador.

Se establece que, para el cálculo de una muestra depende de tres factores, “el
primero se refiere al porcentaje de confianza con que se desea generalizar los datos,
segundo; el porcentaje de error que se está dispuesto a aceptar en tal generalización y
tercero, el nivel de variabilidad que se calcula para la comprobación de la hipótesis”.
(Castañeda et al.; 2006). Además, establece dos fórmulas para el cálculo de una muestra,
sea esta para poblaciones finitas e infinitas.
Z 2 . p.q
Población finita n =
e2
Z 2 . p.q.N
Población infinita n =
Ne 2 + Z 2 pq
La Especificación de la Precisión.

La precisión deseada se puede establecer, al definir la cantidad de error tolerable en


las estimaciones muestrales. En ocasiones, es difícil saber que tanto error debería tolerarse,
particularmente cuando los resultados se destinan a varios fines. De modo que el límite de
error que se escoge es en cierta medida arbitrario.

Tipos de muestreos.

En los siguientes párrafos se desarrollan sobre los tipos de muestreos que se


pueden utilizar para la selección de la muestra, pudiendo esto ser muestreos
probabilísticos y no probabilísticos.

Muestreo probabilístico

“Las unidades de muestreo se seleccionan por casualidad. Se puede especificar


previamente cada posible muestra de un tamaño dado que podría tomarse de la
población, así como la probabilidad de seleccionar cada muestra. Cada posible
muestra no necesita tener la misma probabilidad de selección, pero se puede
especificar la probabilidad de seleccionar una muestra en particular de un tamaño
dado, esto requiere no solo una definición precisa de la población objetivo, sino
también una especificación general del marco de muestreo, debido a que los
elementos de muestra se seleccionan por casualidad, se puede determinar la
precisión de los estimados de muestra de las características de interés, así como los
intervalos de confianza, nivel de confianza y el error estimado”. (Naresh; 2004)
Los métodos probabilísticos de muestreo, son aquellos que se basan en el principio
de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamaño “n” tienen la misma probabilidad de ser elegidas. El
muestreo probabilístico nos asegura la representatividad de la muestra extraída y es, por
tanto, el más recomendable. El principio probabilístico que rige el procedimiento es, que
en el muestreo aleatorio todos los elementos tienen la misma probabilidad de ser elegidos.
(Fernández; 2004)

Los individuos que formarán parte de la muestra se elegirán al azar mediante


números aleatorios. Existen varios métodos para obtener números aleatorios, los más
frecuentes son la utilización de tablas de números aleatorios o generados por computador.
En este caso podemos distinguir varios tipos de muestreo aleatorio o probabilístico que
puede realizarse de distintas maneras, las más frecuentes son el muestreo simple, el
sistemático, el estratificado, el muestreo por conglomerados y el muestreo por etapas.

Tipos de muestreo probabilístico

Existen cuatro tipos de muestreo probabilístico que se enuncian en los siguientes


párrafos. (Sharon; 2000)

Muestreo Aleatorio Simple (M.A.S)

Es aquel en el que cada individuo de la población tiene las mismas posibilidades de


ser seleccionado en la muestra. Es la forma más sencilla de realizar un muestreo
probabilístico. Se obtiene una muestra aleatoria simple de tamaño n cuando cualquier
subconjunto posible de n unidades en la población tiene la misma probabilidad de ser
seleccionada para componer la muestra.

“Es el procedimiento de muestreo mediante el cual extraemos de una población


una muestra representativa de la misma, y donde elemento de la población tiene la
posibilidad de ser incluido en la muestra. En términos de probabilidad, de ser “N” el
tamaño de la población, 1/N la probabilidad de ser escogido cada elemento de la muestra
(Salama, 2002)

Estimación del tamaño de la muestra

Con frecuencia, un investigador mide distintas variables y tiene varios objetivos en


un estudio. Una persona quiere diseñar una muestra aleatoria simple debe utilizar la
cantidad de error de muestreo en las estimaciones que sea tolerable y debe equilibrar la
precisión de las estimaciones con el costo del estudio. Aunque se pueden medir muchas
variables, con frecuencia un investigador debe centrarse en una en una o dos respuestas que
sea de interés fundamental en el estudio. (Naresh; 2004)

Muestreo sistemático

En el que se elige un individuo al azar y a partir de él, a intervalos constantes, se


eligen los demás hasta completar la muestra.

En situaciones, el muestreo sistemático se utiliza como sustituto del muestreo


aleatorio simple, cuando no se dispone de una lista de la población o cuando esta última
tiene un orden más o menos aleatorio. Para obtener una muestra sistemática, se elige una
muestra de tamaño n y sea k el siguiente entero después de N/n. Luego determinamos un
numero aleatorio R entre 1 y k, el cual determina que la muestra esté formada por las
unidades numeradas R, R + k, R + 2k,… R +(n –1) k.

Muestreo estratificado

En este muestreo se divide la población en clases o estratos y se escoge,


aleatoriamente, un número de individuos de cada estrato proporcional al número de
componentes de cada estrato.

Muestreo estratificado, es cuando nos interesa que la muestra tenga la misma


composición de la población la cual, se divide en clases o estratos. Si en la población, son
visibles distintos estratos en proporciones diferentes, se mantendrá la misma proporción
en la muestra tal como se manifiesta en la población. (Boza Chirino y Perez;2004)
Muestreo no probabilístico

“El muestreo no probabilístico se basa en el juicio personal del investigador más


que en la oportunidad de seleccionar elementos de muestra. El investigador puede
decidir de manera arbitraria o consciente qué elementos incluir en la muestra. Las
muestras no probabilísticas pueden arrojar buenos estimativos de las características
de población, sin embargo, no permiten la evaluación objetiva de la precisión de
los resultados de la muestra, debido a que no hay forma de determinar la
probabilidad de seleccionar un elemento en particular para su inclusión en la
muestra, los estimados obtenidos no son proyectables a la población en forma
estadística” (Naresh; 2004)

Tipos de muestreo no probabilísticos


Muestreo por cuotas

También denominado en ocasiones "accidental". Se asienta generalmente sobre la


base de un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad
de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de


individuos que reúnen unas determinadas condiciones.

Se considera que “en este tipo de muestreo hay que asegurarse de incluir algunos
elementos de la población en la muestra. La población de un muestreo por cuota se haría
de tal manera que se respetaría esta distribución en la muestra”. Busca a veces construir una
muestra representativa de una población controlando las características de las unidades de
muestreos seleccionados. De esta manera, la distribución de esas características en la
muestra coincide con lo que se observa en la población. (Sanabria, et al; 2003)
Muestreo intencional

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras


"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es
muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.

El muestreo intencional “es un procedimiento que permite seleccionar los casos


característicos de la población limitando la muestra a estos casos. Se utiliza en situaciones
en las que la población es muy variable y consecuentemente la muestra es muy pequeña”
(Ávila, 2002)

Muestreo por conveniencia

El muestreo por conveniencia “Intenta obtener una muestra de elementos


conveniente. La selección de unidades de muestreo se deja principalmente al entrevistador,
a menudo los encuestados se seleccionan porque están en el lugar correcto en el tiempo
apropiado”. (Naresh; 2004)

Las ventajas del muestreo por conveniencia es que menos costosa y se puede
realizar en el menor tiempo, ya que las unidades de las unidades de muestreo es accesibles,
fáciles de medir y cooperativas.

Bola de nieve

El muestreo por bolas de nieve, generalmente se localiza a algunos individuos, los


cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

El muestreo bolas de nieve es “el muestreo de bolas de nieve se selecciona un


grupo inicial de encuestado, generalmente al azar. Después de ser entrevistados se les pide
que identifiquen a otros que pertenecen a la población de interés. Los encuestados
subsecuentes se seleccionan con base en sus referencias. Este proceso se puede realizar en
ondas, obteniendo referencias de las referencias, lo que lleva, por lo tanto, a un efecto de
bola de nieve”. (Naresh; 2004)

Muestreo por juicio

El muestreo por juicio es “cuando el investigador selecciona una muestra


únicamente porque juzga que esa muestra permite alcanzar los objetivos de la
investigación” (Sanabria, et al; 2003)

El muestreo por juicio es “una forma de muestreo por conveniencia en que los
elementos de la población se seleccionan con base en el juicio del investigador, el cual,
empleando su juicio o experiencia, elige a los elementos que se incluirán en la muestra
porque cree que son representativos de la población de interés o que son apropiados en
alguna forma” (Naresh; 2004)

Limitaciones del uso del muestreo no probabilístico

El riesgo está presente al inferir sobre muestras; incluso siguiendo un riguroso


procedimiento para seleccionar las muestras, el factor psicológico puede afectar la opinión
de los usuarios de esa información. Los datos son tomados siguiendo parámetros
adecuados, según sea el caso de cualquier investigación, aún así, un muestreo estadístico
no se compara a un estudio completo, pero este último no es posible ni viable en muchos
casos.

Las dimensiones de la población y la muestra, son una limitación en cuanto a la


amplitud del muestreo, pues en el caso de que se necesite un estudio completo de todos los
elementos de una población, el muestreo no sería una herramienta útil, pues solo abarcaría
una parte. Otra limitante es cuando la población es tan pequeña que un muestreo no
reflejaría adecuadamente ese universo, pues se requiere tomar una muestra de una
población pequeña, lo cual no la haría representativa, tanto como se aspira.

La dificultad de la aplicación de un muestreo es limitante, pues requiere una


capacitación del personal a realizarlo, desde quienes determinan la extensión de las
pruebas, hasta quienes recopilan datos y los analizan. Esto supone cierto grado de
entrenamiento y preparación, al menos a niveles básicos.
Análisis estadísticos
En el método estadístico, una vez que se ha determinado la variable que va ser objeto de
estudio y se ha limitado la población a la que se aplicará – seleccionado una muestra si
fuera necesario, se recogen los datos que deben ser ordenados posteriormente. La
tabulación de los datos o distribución de frecuencias, es un resumen de datos que indica las
veces que ocurre cada característica o valor de la variable en estudio, así como otros datos
numéricos que ayudan a la identificación de las características sobresalientes del grupo.

Tabla de frecuencia
Los datos que se organizan en tablas de frecuencias con la finalidad de sintetizar la
información que ellos contengan, permitiendo una primera interpretación de los hechos en
estudio.
Frecuencia absoluta: es la cantidad de veces que se repite cada valor de la variable. La
suma de todas las frecuencias absolutas da el número total de datos.
Frecuencia acumulada: es la que informa del número de datos que se hallan hasta un
determinado dato. Es el resultado que se obtiene al sumar la frecuencia absoluta del mismo
y las anteriores a él.
Frecuencia relativa: es el cociente entre la frecuencia absoluta de cada valor de la variable
y el número total de datos. La suma de todas las frecuencias relativa da uno.
Frecuencia porcentual: es la que se obtiene multiplicando por cien la frecuencia relativa.
La suma de la frecuencia porcentual da 100.

Tipos de datos.
Datos agrupados: son aquellos que se agrupan y se distribuyen en grupos o categorías
(clases) de dos más valores cuando se dispone de una gran cantidad de datos (n mayores a
30)
Datos simples o no agrupados: cuando los datos observados no constituyen un grupo o
tamaño, cuando se tiene datos poco numerosos (n menores a 30)
Ejercicios
1) Las calificaciones en estadística de un grupo de estudiantes de cierta universidad se
observa a continuación
1 2 4 5 1 2 3 4 5 1 1 2 1
2 1 4 1 1 1 2 3 1 2 3 3 4
1 2 3 4 5 1 2 2 2 2 1 2 4
4 1 2 1 5 4 1 2 1 1 1 3 3

Calificaciones Frecuencia FR FP F.Ac


absoluta F
1 19 19/52=0,37 0,37*100=37 19/52= 0,37
2 14 14/52=0,27 0,27*100=27 33/52= 0,63
3 7 7/52=0,13 0,13*100=13 40/52=0,76
4 8 8/52=0,15 0,15*100=15 48/52=0,92
5 4 4/52=0,08 0,08*100=8 52/52=1
Total 52 1 100
Con estos datos, hallar: frecuencia relativa, frecuencia porcentual y frecuencia acumulada
y responda las siguientes preguntas: a) porcentaje de alumnos aprobados b) porcentaje de
alumnos con calificaciones mayores a 3 c) porcentaje de alumnos que aprobaron con notas
menores a 4. d) porcentaje de alumnos reprobados

2) La tabla de abajo muestra las edades de 30 alumnos de un curso de guitarra.


Edad Frecuencia absoluta
11 9
12 15
13 3
14 3
Total

Con estos datos, hallar: a) frecuencia relativa, porcentual y acumulada b) porcentaje de


alumnos que tienen mayores a 11 años c) porcentaje de alumnos que tienen 13 años.
3) Se realizó una encuesta para conocer las preferencias de los estudiantes por algunos
estilos musicales
Estilos musicales Frecuencia absoluta
Rock 180
Reggaetón 200
Pop 80
Romántica 120
Tropical 130
Latina 100
Folklórica 40
Total

Con estos datos, hallar: a) frecuencia relativa, porcentual ya acumulada. b) porcentaje


de chicos que prefieren el rock c) porcentaje de chicos que no prefieren la música
tropical d) cantidad de chicos que prefieren la música folklórica.
4) En el siguiente cuadro se representa las estaturas de 40 personas en cm.

Estaturas en cm Frecuencias Fr FP FAc


149 – 154 2 2/40=0,05 0,05*100=5 2/40
155 – 159 4 4/40=0,1 0,1*100=10 6/40
160 - 164 11 11/40=0,27 0,27*100=27 17/40
165 – 169 14 14/40=0,35 0,35*100=35 31/40
170 – 174 5 5/40=0,13 0,13*100=13 36/40
175 – 179 4 4/40=0,1 0,1*100=10 40/40
Total 40 1 100

Con estos datos, hallar: frecuencia relativa, porcentual y acumulada


Representación grafica
Son representaciones graficas de los fenómenos estudiados, que facilitan la comprensión de
las tablas de frecuencias. Lo más utilizados son: grafico de barras (verticales y
horizontales), grafico circular, grafico lineal, histograma, polígono de frecuencia.

Gráficos de barras
Es un gráfico en el cual se coloca la variable sobre uno de los ejes y las frecuencias sobre
el otro eje o viceversa, trazando rectángulos separados sobre los valores de la variable y con
alturas que coinciden con la frecuencia absoluta.
Grafico circular
Consiste en dividir un círculo en sectores circulares, de forma que cada sector represente
uno de los valores de la variable y cuyo ángulo sea proporcional a su correspondiente
frecuencia. Se usa para expresar gráficamente la proporción o porcentaje en que aparece
cada valor de la variable con respecto al total. Se obtiene al multiplicar la frecuencia
relativa por 360.

Grafico lineal
Son también denominados de tendencias. Se utiliza generalmente para analizar la
evolución de una variable en el tiempo. Sobre el eje de las abscisas se coloca la variable
(tiempo) y sobre el eje de las ordenadas, las frecuencias. Se forman uniendo, mediante una
línea poligonal, los puntos que indican las frecuencias absolutas observadas.

Histograma
Es el grafico de barras que se utiliza para representar variables cuantitativas continuas
agrupadas en intervalos, con la diferencia de que los rectángulos están unidos a otros,
justamente porque se trata de variables continuas que se cuantifican con números
decimales.
Polígonos de frecuencias
El polígono de frecuencia es un gráfico lineal que se obtiene uniendo los puntos medios de
las barras superiores de los rectángulos del histograma correspondiente.

Ejercicios
1. Las informaciones se refieren al comportamiento del tiempo en un periodo de un
mes. Soleado 12 días, sol y nubes 9 días, nublado 5 días, lluvia 4 días. Con estos
datos construyo un una tabla de frecuencia y un gráfico de barra.
2. En una caja hay 36 lápices de colores de los cuales, 11 son rojas, 4 azules, 8 verdes
y 10 amarillas y 3 marrones. Con estos datos construya una tabla de frecuencia y
un gráfico de barra.
3. Realiza un diagrama de sectores para los siguientes datos, color de pelo: moreno
124, castaño 214, rubio 315, pelirrojo 53.
4. Construya un gráfico circular sobre las preferencias de votantes para una
determinada elección, candidato A 153 votos, candidato B 35 votos, candidato C
112 votos.
5. Construya un gráfico lineal para la información que se presenta a continuación
Días
Temperatura Domingo Lunes Martes Miércoles Jueves Viernes Sábado
Máxima 16 15 17 19 18 23 27
Mínima 11 10 9 12 7 8 21

6. Los datos de abajo representa lluvias caídas en una determinada zona, realizar un
gráfico lineal

Meses 01 02 03 04 05 06 07 08 09 10 11 12
Lluvias 26 18 17 15 20 10 12 10 15 22 27 40

7. Con los datos de la tabla construya un histograma y polígono de frecuencia

Estaturas en cm Frecuencias Marca de clase (x)


149 – 154 2
155 – 160 4
161 - 166 11
167 – 172 14
173 – 178 5
179 – 184 4
Total

Medidas de centralización y dispersión


Centralización
Indican valores con respecto a que dato central debe agruparse los demás datos. Ejemplo Media,
mediana y moda

Dispersión
Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.
Ejemplo Desviación típica, varianza
Rango: es la diferencia entre el máximo y el mínimo

Datos Simples (Para datos menores de 30)

1. Media
1.1. MEDIA ARITMÉTICA: Es el promedio más comúnmente usado, la media aritmética está

x i

dada por la formula x = y que significa: la suma de todos los valores dividida por el
N
número de datos.
x + x 2 + x3 + ........ + x n
x i

x= 1 =
N N
1.2.Media aritmética ponderada: a veces se asocia a los números X1, X2, … Xk
ciertos factores o pesos W1, W2… Wk que dependen de la significación o
importancia de cada uno de los números, en este caso

 wX i
W1 X 1 + W2 X 2 + .... + Wk X k
x= =
w W1 + W2 + .... + Wk
1.3.Media Geométrica: la media geométrica G de una serie de N números X1, X2, …
Xn es la raíz n – esima del producto de los números:
G = n X 1 . X 2 .... X n
1.4.Media Armónica: la media armónica H de una serie de N números X1, X2, …
Xn es la reciproca de la media aritmética de los recíprocos de los números

1 N
H= =
 xi  xi
N
2. MEDIANA ( el valor central o el que representa el 50 % de los datos)

El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de
la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces
la mediana se obtendrá sacando el promedio de ellos
La mediana toma en cuenta la posición de los datos y se define como el valor central de una serie de
datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son
menores que el y no más de la mitad mayores.
x1 x 2 x 3 x 4 x 5 x 6 x 7 x1 x 2 x 3 x 4 x 5 x 6

Cuando la cantidad de datos es impar Cuando la cantidad de datos es par se


Se toma el valor central se promedia los valores
x + x4
centrales 3 =
2

3. MODA: ( valor o dato que se presenta con mayor frecuencia)

La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere
fácilmente: es la altura más corriente, es la velocidad más común, etc. Además tiene la ventaja de
que no se ve afectada por la presencia de valores altos o bajos. La moda es utilizada generalmente
cuando se presentan variables cualitativas.

4. DESVIACION TIPICA: Es la raíz cuadrada de la varianza


Es la más utilizada de todas las medidas de variabilidad. Se puede definir como la raíz
cuadrada de los promedios de los cuadrados de las desviaciones de las medidas con
respecto a la media aritmética La desviación Típica se utiliza para:
Comparar grupos, es decir a mayor desviación típica, mayor variación dentro del grupo

=
(x1 − x)2 + (x2 − x)2 + (x3 − x)2 + ........ + (xn − x)2 =
N

Ejercicios

1) La siguiente tabla indica las alturas redondeadas en pulgadas (in) una muestra de 7
estudiantes varones.

Altura (X) 70 63 72 60 66 70 74

Encontrar Para cada variable si es posible: a) la media, b) la mediana c) la moda d) la


desviación.
2) Se mira el color del cabello a 28 personas y se obtiene: negro, pelirrojo, rubio,
castaño, castaño, pelirrojo, negro, negro, rubio, pelirrojo, castaño, castaño, castaño,
pelirrojo, rubio, negro, castaño, pelirrojo, castaño, pelirrojo, negro, rubio, rubio, rubio,
negro, negro, castaño, negro. ¿Cuál es la medida de tendencia central que recomendarías en
esta observación y cuál sería el resultado?
3) De un curso fueron seleccionados seis estudiantes para hacer investigaciones referentes
al peso del grupo; el peso de los seis estudiantes esta expresado en Kg.; de la siguiente
manera:
83 69 77 70 69 67
Calcular: a) La media, b) La mediana, c) La moda d) La desviación típica.

4) Se analizan los rendimientos de los alumnos X e Y en el módulo de estadística ,


obteniendo las siguientes puntuaciones:
X: 85 74 75 90 87
Y: 82 69 75 95 90
Determine cuál de los alumnos es el de mejor en rendimiento y ¿Por qué?
5) Determina qué medidas de tendencia central serían más útiles en cada uno de los
siguientes casos:
a) El gerente de producción de una fábrica de envases de vidrio quiere saber cuál es el
tamaño de envase que debe fabricar en mayor cantidad. Él tiene a mano buen
número de datos de los tamaños de envase ordenados por los clientes.
b) Veinticinco entrevistas personales para un puesto bacante, durante 37, 30, 23, 46,
42, 18, 40, 58, 43, 39, 55, 64, 42, 28, 21, 57, 40, 57, 59, 42, 35, 26, 13, 42 y 38
minutos. Determinar: a) la media, b) la mediana c) la moda de la duración de esta
entrevista.
c) Una familia pagó en sus cuentas de luz, en tres, meses diferentes, las siguientes
cantidades en guaraníes: 48.000; 52.000 y 65.000. Si el cuarto mes bajo el consumo
al promedio de los tres pagos anteriores ¿Cuánto pagó la familia en el cuarto mes en
guaraníes?

Datos Agrupados (Para datos mayores de 30)

 FX Referencias
X = media
Media X =
N F = Frecuencia absoluta
X = marca de clase
N 
 −  fi  N = número total de datos
Mediana Med = Li +  2 .C Li = limite real inferior de la clase mediana o modal
 fmed  Σfi= suma de todas las frecuencias por encima de la mediana
 
  Fmed = frecuencia absoluta de la clase mediana
C = tamaño o anchura de cada intervalo de clase
 1  Δ1 = exceso de la frecuencia modal por encima de la frecuencia
Moda Mod = Li +  .C
 1 +  2
absoluta

Δ2 = exceso de la frecuencia modal por debajo de la frecuencia

Desviación típica  =
 fX 2

−X
2
absoluta

Ejercicios
1) En la tabla se registra la altura de 40 estudiantes varones de la universidad “XYZ”, las
alturas de los estudiantes fueron tomadas en centímetros.
Estaturas en cm Frecuencias X
149 – 153 2
154 – 158 4
159 - 163 11
164 – 168 14
169 – 173 5
174 – 178 4
Total
Calcular: a) La media b) La mediana c) La moda d) desviación típica

2) En la tabla se registra la edad de los ciudadanos de una ciudad

Estaturas en cm Frecuencias X
0–8 13
9 – 17 35
18 - 26 38
27 – 35 47
36 – 44 44
45 – 53 8
54 – 62 5
Total

Calcular: a) La media b) La mediana c) La moda d) desviación típica


3) Los datos de la tabla indican las horas de estudio que dedican un grupo de estudiantes
fuera del horario escolar

Intervalos Frecuencia
de clase
8 - 14 13
15 – 21 10
22 – 28 16
29 – 35 11
36 – 42 6
43 – 49 4
Total

Calcula:
a) Media b) Mediana c) Moda d) Desviación típica e) Histograma y polígono
de frecuencia

Probabilidad

Se define como cálculo de probabilidad al conjunto de reglas que permiten determinar si un


fenómeno ha de producirse, fundando la suposición en el cálculo, las estadísticas o la
teoría

Enfoque Clásico

Si hay n posibles resultados favorables a la ocurrencia de un evento N posibles resultados y


todos los resultados son igualmente posibles y mutuamente excluyente (no pueden ocurrir
los dos al mismo tiempo), entonces la probabilidad se define como

𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑛
𝑝= =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑁

El enfoque subjetivo

Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un


individuo de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta
premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de
ocurrencia del evento. Es decir, que el evento ocurrirá o no ocurrirá esa sola vez. El valor
de probabilidad bajo este enfoque es un juicio personal.

El enfoque de frecuencia relativa


También llamado Enfoque Empírico, determina la probabilidad sobre la base de la
proporción de veces que ocurre un evento favorable en un número de observaciones. En
este enfoque no ese utiliza la suposición previa de aleatoriedad. Porque la determinación de
los valores de probabilidad se basa en la observación y recopilación de datos.

Se deduce de la definición lo siguiente:

0 ≤ 𝑃(𝐸 ) ≤ 1 La medición probabilística es un número real entre 0 y 1

𝑃(𝜙) = 0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑒𝑠 𝑐𝑎𝑠𝑖 𝑠𝑒𝑔𝑢𝑟𝑜 𝑞𝑢𝑒 𝑛𝑜 𝑜𝑐𝑢𝑟𝑟𝑖𝑟𝑎

𝑃(𝐸 ) = 1 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑒𝑠 𝑐𝑎𝑠𝑖 𝑠𝑒𝑔𝑢𝑟𝑜 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑖𝑟𝑎

p(E) = 1 p(A) > 0

Eventos Independientes

Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento


no tiene efecto sobre la probabilidad de ocurrencia del otro evento.

Probabilidad condicional

Probabilidad condicional es la probabilidad de que ocurra un evento A A, sabiendo que


también sucede otro evento B. La probabilidad condicional se escribe P(A|B) o P(A/B), y se
lee «la probabilidad de A dado B».

No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el
tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o
pueden no tener relación causal. Las relaciones causales o temporales son nociones que no
pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de
la interpretación que se le dé a los eventos.

Un ejemplo clásico es el lanzamiento de una moneda para luego lanzar un dado. ¿Cuál es la
probabilidad que en el dado salga un 6 dado que ya haya salido una cara en la moneda?
Esta probabilidad se denota de esta manera: P(6|C).

Dado un espacio de probabilidad y dos eventos o sucesos, la probabilidad condicional de A


dado B está definida como:
Ejercicios

1) Una caja contiene 11 boletos enumerados del 1 al 11. Si se extrae al azar uno por vez, halla la
probabilidad de que sea:
5 6 4
a) Un número par R= b) Un número impar R= c) Menor que cinco. R=
11 11 11
2) Un ropero contiene 8 remeras rojas, 6 remeras azules y 4 blancas, cual es probabilidad de
elegir:
1 5
a) Una remera azul. R= b) Una remera azul o blanca. R= c) Una remera no
3 9
2
azul. R =
3
2
d) Dos remeras, una azul y otra blanca. R= e) Dos remeras, una roja y otra blanca
27
8
R=
81
3) Se confecciona una bandera con tres franjas horizontales de diferentes colores: rojo, blanco y
azul. Calcular la probabilidad de:
1
a) que se forme la bandera paraguaya R= b) que el azul quede en la franja de abajo
6
1
R=
3
4) Una caja contiene 7 bolas, de las cuales 5 son blancas y 2 azules. Cual es la probabilidad de
que sacando al azar sin reposición, dos bolas ( una después de la otra)
5
a) el primero sea blanco y el segundo azul. R= b) el primero sea blanco y el
21
10
segundo sea blanco. R =
21
5) Cuál es la probabilidad de que una pareja tenga tres hijos:
1 7
a) Del mismo sexo. R= b) Por lo menos un hombre R= c) Una mujer. R=
4 8
3
8

Probabilidad Condicional

Probabilidad condicional: La ocurrencia del evento “B” depende de la ocurrencia


del evento “A”.

PB( A) = P(PA(A)B ) ..............P( A)  0


P( A  B) = Es la probabilidad que los eventos ocurran simultáneamente. (Tengan
elementos comunes)
9) La tabla representa las reacciones de los votantes con respecto a un nuevo plan tributario para
el 2014

Afiliación Reacción Suma


Partidaria A Favor Neutral Se Opone
ANR 120 20 20 160
PLRA 50 30 60 140
Determina: OTROS 50 10 40 100
220 60 120 400

3
a) Cual es la probabilidad que el votante se oponga al plan, dado que pertenece PLRA. R =
7
P(OP/PLRA) =60/140 = 3/7
b) Cual es la probabilidad de que el votante sea de la ANR, sabiendo que se opone al plan.
1
R=
6
P(ANR/OP) =20/120 = 1/6

10) Una muestra aleatoria de 200 adultos se clasifica abajo por sexo y su nivel de educación.

Educación Hombre Mujer Total


Primaria 38 45
Secundaria 28 50
Universitaria 22 17
Total

Si se escoge una persona al azar de este grupo, encuentre la probabilidad de que:


14
a) La persona sea hombre, dado que la persona tiene una educación secundaria. R=
39
P(H/S) = 28/ 78 = 14/39
95
b) La persona no tiene grado universitario, dado que la persona es mujer. R=
112
P(NGU/M) =95/112

11) Un experimento para estudiar la relación de la hipertensión arterial y los hábitos de fumar, se
reúnen en los siguientes datos para 180 individuos.

No Fumadores Fumadores Total


Fumadores Moderados Empedernidos
Con 21 36 30
Hipertensión
Sin Hipertensión 48 26 19
Total
Si se selecciona uno de estos individuos al azar, encuentre la probabilidad de que la persona:
30
a) Sufre hipertensión, dado que la persona es un fumador empedernido. R=
49
16
b) Sea no fumador, dado que la persona no sufre de hipertensión. R=
31

12) En una empresa hay 45 empleados, 29 hombres (H) y 16 mujeres (M); de ellos, 7 hombres y 5
mujeres son fumadores (F).

Calcula las probabilidades:


a) P(H ) = 29/45 b) P(M ) = 16/45 c) P (F ) = 12/45
( F )=
d) P H 7/ 12 ( M ) = 5/16
e) P F

H M T
F 7 5 12
NF 22 11 33
T 29 16 45

Distribución Binomial

Supongamos que un experimento aleatorio tiene las siguientes características:

• En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su
contrario 𝐴̅ (fracaso).
• El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
• La probabilidad del suceso A es constante, la representamos por p, y no varía de una
prueba a otra. La probabilidad de 𝐴̅ es 1- p y la representamos por q.
• El experimento consta de un número n de pruebas.

Todo experimento que tenga estas características diremos que sigue el modelo de la distribución
Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del
experimento, la llamaremos variable aleatoria binomial.

Función de Probabilidad de la v.a. Binomial

𝑃(𝑋) = 𝑛 𝐶 𝑥 . 𝑝 𝑥 . 𝑞 𝑛−𝑥

𝒏 = 𝑁º 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠 𝑝𝑟𝑎𝑐𝑡𝑖𝑐𝑎𝑑𝑜𝑠.
𝒙 = 𝑁º 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠 𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜𝑠 𝑒𝑛 𝒏 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝒑 = 𝐿𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝒒 = 1 − 𝑝 𝑒𝑠 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜.

15
1) La probabilidad de obtener 2 caras en 6 lanzamientos de una moneda. R =
64

2) Encuentre la probabilidad de que una familia de 4 hijos haya tenido, al menos un varón. R=
15
16

3) Un cazador mata patos atina al blanco el 40% de las veces, si hoy le disparo a 12 patos,
calcular la probabilidad de que haya fallado 3 veces. R = 0,01246
4) Celeste violeta amarilla de rojas es la alumna más distinguida del salón tiene probabilidad
del 40% de reprobar la materia, calcular la probabilidad de que apruebe 3 de los 5
exámenes parciales. R =0,3456
5) Un prominente medico afirma que el 70 % de las personas con cáncer de pulmón son
fumadores empedernidos, si su aseveración es correcta. Encuentre la probabilidad de que
de 10 de tales pacientes admitidos recientemente en hospital, menos de la mitad sean
fumadores empedernidos. R =0,0474
6) La probabilidad de que una persona se recupere de una enfermedad sanguínea es del
40%. Si sabe que 15 personas contraen esta enfermedad. Cuál es la probabilidad de que:
a) Sobrevivan al menos 1 pacientes. R= 0,033833 b) Sobrevivan de 3 a 4 pacientes.

Distribución de Poisson

La llamada distribución de probabilidad de Poisson describe la cantidad de veces que ocurre un


evento en un intervalo determinado. El intervalo puede ser de tiempo, distancia, área o volumen.
La distribución de Poisson tiene las siguientes características.

1. Describe el número de veces que ocurre un evento en un intervalo específico


2. La probabilidad de un “éxito” es proporcional a la extensión del intervalo.
3. Los intervalos que no se sobreponen son los independientes.
4. Es una forma límite de la distribución binomial cuando el número total de ensayos es
grande y la probabilidad de éxito es pequeña.

Función de Probabilidad de la v.a. Poisson

𝜆𝑥 . 𝑒 −𝜆
𝑃 (𝑥 ) =
𝑥!
𝒏 = 𝑁º 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠 𝑝𝑟𝑎𝑐𝑡𝑖𝑐𝑎𝑑𝑜𝑠
𝒙 = 𝑁º 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠 𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜𝑠 𝑒𝑛 𝒏 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝝀 = 𝐸𝑠 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜. (𝝀 = 𝒏. 𝒑)
𝒆 = 2,71828 ….
1) En el interior del país, como promedio mueren 2 vacas mensualmente electrocutadas por
rayos. Indicar la probabilidad de que en un mes determinado mueran 4 vacas (suponer
que no hay influencia estacional o geográfica en la posible cantidad de accidentes). R =
0,09
Datos
Lamda =
X=4
P(x =4) = 24e -2/(4!) =

2) Si ya se conoce que solo el 3% de los alumnos de Contabilidad son muy inteligentes


¿calcular la probabilidad de que si tomamos 100 alumnos al azar 5 de ellos sean muy
inteligentes. R = 0.1008
Lamda = 0.003*100 = 3
X= 5

P(5 =4) = 35e -3/(5!) =


3) Según la oficina nacional de estadística, el promedio total de ahogamiento es de 3
personas por cada 100.000 habitantes. Encuentre la probabilidad de que una cuidad de
200.000 habitantes haya:
a) Ningún ahogado. R= 0,002479 b) 2 ahogados. R= 0,044618
4) Si la probabilidad de que una persona tenga mala reacción a la inyección de determinado
suero es de 0,001. Determinar la probabilidad de que cada 2000 individuos: a)
Exactamente 3 tenga una reacción mala. R= 0,180447 b) Más de 2 individuos tenga una
reacción mala. R= 0,323324
5) Cierto tipo de renacuajos se distribuyen aleatoriamente en una laguna en la razón de 14
por litro. Se toma una muestra al azar de 0,1 litro. ¿Cuál sería la probabilidad de que
contenga más de 3 renacuajos? R = 0,0538
6) La producción de televisores en SAMSUNG trae asociada una probabilidad de defecto del
2%, si se toma un lote o muestra de 85 televisores, obtener la probabilidad de que existan
4 televisores con defectos. R = 0.06357
7) Una secretaria comete 2 errores por página, en promedio. Cuál es la probabilidad de que
en la siguiente página cometa: a) Ningún Error. R= 0,135335 b) Cuatro o más Errores. R=
0,142876

Distribución normal

En estadística y probabilidad se llama distribución normal, distribución de Gauss,


distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece en estadística y en la
teoría de probabilidades.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto


de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y
es el gráfico de una función gaussiana.

Función de densidad de probabilidad

X −
Z=


X = media muestral
u = media poblacional
 = desviación típica

Ejercicios
1) Se supone que los resultados de un examen siguen una distribución normal con media 78
y desviación típica 6. Se pide:
a) ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una
calificación menor a 72?
b) ¿Cuál es la probabilidad que la calificación sea mayor a 82?
c) ¿Cuál es la probabilidad sea igual a 74??
d) ¿Cuál es la probabilidad de que tenga puntuación entre 70 y 85?

2)La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3


kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:
1) Entre 60 kg y 75 kg 2) Más de 90 kg 3) Menos de 64 kg 4) 64 kg 5) 64 kg o menos
3) En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del
mes en los que se espera alcanzar máximas entre 21° y 27°.

4) Varios test de inteligencia dieron una puntuación que sigue una ley normal con media
100 y desviación típica 15: a) Determinar el porcentaje de población que obtendría un
coeficiente entre 95 y 110. b) Porcentaje de población que tendría un coeficiente mayor a
115 c) En una población de 2500 individuos ¿cuántos individuos se esperan que tengan un
coeficiente superior a 125?
Prueba de hipótesis

En la actualidad, muchos problemas de ingeniería, ciencia, y administración, requieren que


se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta
proposición recibe el nombre de hipótesis.

Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos
de problemas de toma de decisiones, pruebas o experimentos en el mundo, pueden
formularse como problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").

La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta


es la hipótesis del investigador.( Datos que brinda la muestra)

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia


muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se
continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones
posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho.

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera.
También es conocido como  ó nivel de significancía.

El error tipo II ó error  se define como la aceptación de la hipótesis nula cuando ésta es
falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que
determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa

Aceptar Ho Decisión correcta Error tipo II ó 

Rechazar Ho Error tipo I ó  Decisión correcta


.

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS

INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO


1. Interpretar correctamente hacia que distribución muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parámetros de los
estadísticos. Así mismo se debe determinar en este punto información implícita como el
tipo de muestreo y si la población es finita o infinita.
3. Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del
problema. El ensayo de hipótesis está en función de parámetros ya que se quiere evaluar
el universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).
4. Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el cual
se obtiene dependiendo del valor de  (Error tipo I o nivel de significancía) o en función
del estadístico límite de la distribución muestral. Cada una de las hipótesis deberá ser
argumentada correctamente para tomar la decisión, la cual estará en función de la
hipótesis nula u Ho.
5. Calcular el estadístico real, y situarlo para tomar la decisión.
6. Justificar la toma de decisión y concluir.

Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:

• Unilateral Derecho
• Unilateral Izquierdo
• Bilateral

Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.

• Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el


parámetro, en este caso el nivel de significancía se carga todo hacia el lado derecho, para
definir las regiones de aceptación y de
rechazo.

Ensayo de hipótesis:

Ho; Parámetro u =

H1; Parámetro u  x
• Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en
el parámetro, en este caso el nivel de significancía se carga todo hacia el lado izquierdo,
para definir las regiones de aceptación y de rechazo.

Ensayo de hipótesis:

Ho; Parámetro u =

H1; Parámetro  x

• Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El


nivel de significancía se divide en dos y existen dos regiones de rechazo. (en la pregunta
debe decir, ha cambiado, esto implica que puede ser mayor o menor, y el error se debe
distribuir a ambos lados, por lo
tanto el valor de la tabla se
divide por dos)

Ensayo de hipótesis:

Ho; Parámetro = x

H1; Parámetro  x

Observaciones:

*En donde dice parámetro (se refiere a media (u) o porcentaje (p)
*Por más de que el resultado de la muestra sea menor o mayor, y la pregunta dice ha cambiado se
debe usar el de dos colas (bilaterales)
Tabla de valores de Zt (zeta tabulada) – Prueba de Hipótesis

Los valores de Z t para 1 cola y 2 colas se muestran en la siguiente tabla:

Nivel de
significancia 
0,10 0,05 0,01 0,005 0,002

Valores para Zt
para pruebas de
-1,28 o 1,28 -1,645 o -2,33 o 2,33 -2,58 o 2,58 -2, 88 o 2,88
una cola
1,645

Valores para Zt
para pruebas de
-1,645 o -1,96 o 1,96 -2,58 o 2,58 -2,81 o 2,81 -3,08 o 3,08
dos cola
1,645

Ejemplos:

Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional
de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años?
Utilice un nivel de significancia de 0.05.

1) Datos, se deben sacar los datos:


u = 70, se refiere a los datos de la población.
δ = 8,9, desviación típica de la población
n = 100 la muestra
x = 71,8 (x barra) es lo que está en la pregunta
α = 0,05
2) Se plantea hipótesis
Ho: u = 70, como el enunciado se trata de media o promedio se usa (u)
H1: u > 70, se usa mayor a 70 porque el resultado de la muestra salió 71,8; el resultado de la
muestra indica si es mayor menor, lo cual indica que es unilateral derecho

3) Nivel de significación y valor de Zt


α = 0,05
Zt = 1,645 ( si es derecho se usa positivo, si es izquierdo se usa el negativo)
4) Calculo de Zc = z calculada
Se usa la fórmula de Z
x−
Z=

n
71,8 − 70
Z= se calcula su valor en la calculadora
8 .9
100
Z c = 2,02

5) Regla de decisión

1) Se acepta Ho: si Zc ≤Zt ,


2) Se rechaza Ho: si Zc > Zt

6) Conclusión: como Zc = 2,02 mayor al valor de Zt = 1,645, se rechaza la hipótesis nula (Ho), lo
que implica que el promedio de vida ha sido mayor que 70 años.

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha disminuido?
Utilice un nivel de significancia del 0.002.

1) Datos, se deben sacar los datos:


u = 800
δ = 40
n = 30
x = 788 (x barra) es lo que está en la pregunta
α = 0,002
2) Se plantea hipótesis
Ho: u = 800,
H1: u < 800

3) Nivel de significación y valor de Zt


α = 0,002
Zt = -2,88
4) Calculo de Zc = z calculada
Se usa la fórmula de Z
x−
Z=

n
788 − 800
Z= se calcula su valor en la calculadora
40
30

Z c = −1,643

5) Regla de decisión
1) Se acepta Ho: si Zc ≥ Zt
2) Se rechaza Ho: si Zc < Zt

6) Conclusión
Como el valor de Zc = -1,645 mayor a Zt = -2,88, se acepta Ho, es decir, el promedio de
duración de los focos son aproximadamente 800 horas.

3) Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que
se construyen hoy en día en la ciudad de Richmond. Puede usted estar de acuerdo con
esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15
tienen instaladas bombas de calor. Utilice un nivel de significancia de 0.10.

1) Datos, se deben sacar los datos:


P = 0,7
n = 15
q = 1-0,7 = 0,3
p = 8/15 = 0,53
α = 0,10
2) Se plantea hipótesis
Ho: P = 0,7,
H1: P < 0,7

3) Nivel de significación y valor de Zt


α = 0,10
Zt = -1,28
4) Calculo de Zc = z calculada
Se usa la fórmula de Z
p−P
Z= =
P.q
n
0,53 − 0,70
Z= se calcula su valor en la calculadora
0,7 * 0,3
15

Z c = −1,43

5) Regla de decisión
1) Se acepta Ho: si Zc ≥ Zt
2) Se rechaza Ho: si Zc < Zt

0,1

Zt=-1,28
P =0,7

6) Regla de decision
Como Zc = -1,43 menor a Zt = -1,28, se rechaza Ho, es decir el porcentaje ha sido menor al 70%.

Ejercicios

1. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 40 focos tiene una duración promedio de 815 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha aumentado.
Utilice un nivel de significancia del 0,1.
2. La resistencia al rompimiento de los cable producidos por un fabricante tiene media de
1600 lb y desviación estándar de 90 lb. Se afirma que con la implementación de una
técnica nueva en el proceso se ve disminuida dicha resistencia. Para probar esta
afirmación se probó una muestra de 64 cables y se encontró que la resistencia al
rompimiento es de 1550 lb. Podemos apoyar la afirmación con un nivel de significancia de
0,01.
3. En el pasado una maquina produjo empaques cuyo grosor medio era 0,050 cm. Para
determinar si la maquina estaba trabajando correctamente se tomó una muestra de 10
empaques, para el cual el grosor promedio era de 0, 053 cm y su desviación estándar era
0,003. Pruebe la hipótesis de que la maquina estaba trabajando adecuadamente utilizando
un nivel de significancia de 0,05.
4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación
si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia de 0.10.
5. El fabricante de un medicamento patentado sostiene que tiene una eficacia del 90 % en
aliviar cierta alergia durante un periodo de 8 horas. en una muestra de 200 personas con
dicha alergia, el medicamento mejoro a 160 personas. determine si la afirmación del
fabricante es verídica utilizando un nivel de significancia de 0,01.

También podría gustarte