Silabo de Estadística 2023 - EESTP SB Final
Silabo de Estadística 2023 - EESTP SB Final
SYLLABUS DESARROLLADO DE LA
ASIGNATURA “ESTADÍSTICA”
II PERIODO ACADÉMICO
2023
I. DATOS GENERALES
1
ASIGNATURA : ESTADÍSTICA
PROGRAMA DE ESTUDIO : Ciencias Administrativas y Policiales
EJE CURRICULAR : Formación Técnico Profesional Policial
AREA COGNITIVA : Formación Académica del Programa Regular
HORAS SEMESTRALES : 48 horas académicas
HORAS SEMANALES : 03 Horas
CRÉDITOS : 02
FECHA INICIO/TERMINO : 14AGO23 - DIC23
DIA Y HORA : viernes 16:50 – 19:20
PERIODO ACADÉMICO : II - Promoción 2023 - I
MODALIDAD : Presencial
CATEDRÁTICOS:
II. SUMILLA
2
La presente asignatura aporta al perfil del Técnico Profesional PNP en el curso de
Estadística los métodos y procedimientos para realizar la recopilación,
organización, presentación, análisis e interpretación de datos para la buena toma
de decisiones ante hechos específicos.
Asimismo, presenta las técnicas para el tratamiento de la información y el cálculo
de las medidas de posición, tendencia central, dispersión, casos de probabilidades
y análisis combinatorio aplicados a la función policial.
V. METODOLOGIA:
El desarrollo del curso se basa en la participación activa de las estudiantes
mediante el desarrollo de problemas aplicados a la actividad policial.
VI. CONTENIDOS.
COMPETENCIA
I UNIDAD Comprender los conceptos básicos de la
CONCEPTO BÁSICO DE LA ESTADÍSTICA Estadística descriptiva como inferencial,
DEFINICIÓN DE VARIABLES población, muestra, definición de
variables, tanto cualitativas como
cuantitativas para proyectar soluciones.
3
SESIÓN 01 Reconocer, describir, analizar,
expresar, clasificar y formalizar los
Presentación de la Asignatura.
conceptos de la estadística tanto
Conceptos básicos
descriptiva como inferencial.
Estadística Descriptiva
PRIMERA Identificar el contenido del curso
Estadística Inferencial
Diferencia los conceptos y teorías
SEMANA Población y muestra
Estadísticas.
Parámetro estadístico
(03 hrs) Reconocer que es una población y
una muestra.
18AGO23
Identificar los parámetros
estadísticos
II UNIDAD COMPETENCIA
DISTRIBUCIÓN DE FRECUENCIAS, Preparar el cuadro de distribución de
REPRESENTACIONES GRÁFICAS. frecuencias para su interpretación.
4
SESIÓN 04
Conocer y utilizar sus datos para su
Cuadro de frecuencias para una
análisis.
variable cuantitativa agrupados
Inferir datos sobre medidas
y no agrupados.
CUARTA tendencia central para datos
Distribución de frecuencias por
agrupados y no agrupados
SEMANA intervalo
Interpretar gráficos
Gráficos
(03 hrs) Entrega de temas de Trabajo
08SEP23 Aplicativo Individual (TAI) y
Colaborativo (TC)
COMPETENCIA
III UNIDAD Organizar los estadígrafos de
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN tendencia central y gráficos en la
presentación de diversos datos
frente a la realidad del campo
policial, manifestando confianza y
perseverancia en su aprendizaje.
Conocer y comprender la
agrupación de frecuencias absolutas
SESIÓN 06
SEXTA y relativas simples y acumuladas
Prácticas dirigidas sobre Preparar cuadro de distribución de
SEMANA Población, muestra, evaluación frecuencias.
(03 hrs) de Distribución de frecuencias Ordenar, clasificar los datos y su
con variable cuantitativa y periodicidad.
22SEP23
cualitativa, y gráficas de Realiza la gráfica de frecuencias para
frecuencias, y medidas de su interpretación
tendencia central. Utiliza la media, mediana y moda e
Repaso de las unidades interpreta sus valores.
didácticas anteriores.
SÉPTIMA
SEMANA SESIÓN 07
(03 hrs) PRIMERA EVALUACIÓN PARCIAL
29SEP23
5
SESIÓN 08 Identificar las diferentes medidas de
OCTAVA
posición
Medidas de posición no central
SEMANA Proporcionar información de la
Cuartiles
(03 hrs) variable de estudio en base a los
Deciles
estadígrafos de posición
06OCT23 Percentiles
Relacionar los datos agrupados con
Datos no agrupados y
los porcentajes relacionados
agrupados
6
(03hrs)
03NOV23
COMPETENCIA
IV UNIDAD Conocer las posibilidades que ocurra
PROBABILIDAD Y ANÁLISIS COMBINATORIO un posible resultado en sucesos de
un evento.
Predecir el número de situaciones
que se pueden dar en un conjunto
finito de acciones
DÉCIMA
SESIÓN 13 Afianzar el aprendizaje
TERCERA
Repaso
SUSTENTACION DE TRABAJOS
SEMANA
COLABORATIVOS
(03 hrs)
10NOV23
SESIÓN 14 Calcular la probabilidad de los
posibles resultados de los sucesos.
DÉCIMA Probabilidades. Concepto
Conocer el espacio muestral de los
Teorema de probabilidad
CUARTA eventos.
Espacio muestral
SEMANA Realizar el cálculo del número de
Experimentos y eventos o
posibilidades de múltiples eventos
(03 hrs) sucesos
que ocurren.
Principios fundamentales del
17NOV23 conteo
DÉCIMA SESIÓN 15 Realizar el análisis combinatorio
para diferentes eventos.
QUINTA Análisis combinatorio
Realizar agrupaciones con los
Eventos
SEMANA elementos de un conjunto,
Variables aleatorias discretas y
(03 hrs) formándolas y calculando su
continuas.
número.
24NOV23 Resolver problemas estadísticos con
fórmulas para las Permutaciones,
Combinaciones y ordenaciones de
datos.
DÉCIMA
SESIÓN 16
SEXTA
EVALUACION FINAL
SEMANA
(04 hrs)
01DIC23
VII. EVALUACIÓN
La asistencia a las sesiones es obligatoria en un 100%, salvo situación de servicio,
lo que se informará al Departamento Académico (DACA).
El proceso de evaluación del aprendizaje será permanente, comprenderá:
7
A. Evaluación Diagnóstica o de Entrada para valorar el nivel de conocimiento de la
asignatura.
B. El trabajo aplicativo individual (TAI) se calificará solo la presentación.
C. El trabajo colaborativo (TC) se calificará tanto la presentación como la
sustentación.
D. Evaluación Formativa o de Proceso para comprobar el rendimiento académico,
pronosticar posibilidades de desarrollo de las estudiantes (a) y reorientar la
metodología, se aplicarán:
1. El TAI y TC.
2. Dos exámenes escritos parciales (7º y 12º semana), enmarcados en los
modelos de las Pruebas que son propias de la naturaleza de la Asignatura.
3. Un examen final (16º semana),
V. BIBLIOGRAFIA
Barreto C. (2008). Estadística básica, aplicaciones. Ed. Gráfica Real S.A.C. Perú.
Gómez M. (1977). Estadística descriptiva.
Jhonson K. Estadística elemental
Lipschutz, Seymour & Schiller J. (2000). Introducción a la probabilidad y
estadística. Ed. McGraw Hill.
Martínez C. Estadística aplicada
Quintana C. (1992). Estadística elemental. Ed. Master libro S.A.
Spiegel M. Estadística
Universidad Juárez autónoma de Tabasco. Análisis de datos con herramientas
estadísticas. Recuperado de https://sites.google.com/site/estadisticadm/b-
organizacion-y-presentacon-de-datos/b-3-medidas-de-tendencia-central
8
UNIDAD I
SESIÓN 1
ESTADÍSTICA DESCRIPTIVA - INTRODUCCIÓN
INTRODUCCION
1.1 ESTADISTICA
Ejemplos:
Estudiar la variación mensual del precio del dólar durante los últimos 5 años, para
averiguar qué mes del año es el más favorable para comprar dólares.
Estudiar la variación mensual de efectivos policiales contagiados y fallecidos por el
Covid-19 durante el año 2020.
Hallar el promedio y la varianza de la comisión de los diferentes delitos y faltas
cometidos en el distrito de San Bartolo.
9
b) La estadística inferencial, que desarrolla modelos teóricos que se ajustan a una
determinada realidad con cierto grado de confianza con la finalidad de inferir
resultados.
Estas dos ramas no son independientes; por el contrario, son complementarias y
entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el
fin de que quien tenga poder de decisión, tome las medidas necesarias para
transformar ese futuro o para mantener las condiciones existentes. La estadística
se divide en dos ramas:
ESTADISTICA DESCRIPTIVA
Es la parte de la estadística que consiste en la recolección, organización,
presentación y análisis de datos para su descripción e interpretación según lo
requerido.
ESTADISTICA INFERENCIAL
Es la parte de la estadística que consiste en tomar decisiones sobre el
comportamiento de una variable de interés de una población estadística en
estudio; utilizando para tal objetivo una muestra al azar. Es decir, a partir de los
resultados obtenidos al procesar los datos de una muestra se generaliza el
resultado de dicha variable en la población, con un cierto riesgo que es
cuantificado por la teoría de la probabilidad. La estadística inferencial
proporciona métodos para el análisis de datos.
1.3.1 Población
10
1.3.2 Muestra
Ejemplo 1:
Para estudiar cuál es el candidato presidencial por el cual votarán los peruanos
en las próximas elecciones, se toma una muestra de 3500 personas de todo el
país. La pregunta es la siguiente, ¿por quién votará en las próximas elecciones
presidenciales? Determine la población, muestra e individuos.
En este caso, la población sería la población electoral del país, es decir, peruanos
con derecho a voto.
La muestra sería el conjunto de 3500 peruanos que forman parte de la
población.
Un individuo sería cada uno de los peruanos con derecho a voto.
Ejemplo 2:
Un alumno de la escuela de Suboficiales de la Policía Nacional de San Bartolo
quiere conocer si los profesores de la escuela, prefieren dictar clases con ropa
formal o con ropa informal. Para ello, realiza una encuesta a 60 profesores de la
escuela de Suboficiales elegidos de forma aleatoria. Identifique la población,
muestra e individuos.
Ejemplo 3:
Un profesor desea realizar un análisis estadístico de las notas del examen final de
matemáticas de sus alumnos de último año. Por ello, coloca todas las notas
obtenidas en Excel y usa las funciones y herramientas estadísticas. La
información obtenida, ¿pertenece a la muestra o a la población?
En este caso, la población, son todas las estudiantes de último año. Se estudiarán
sus notas, pero todas las notas obtenidas. No se ha realizado ningún muestreo,
por ello, la información obtenida, pertenece a la población.
11
1.3.3 Unidad Elemental
Dato u observación.
Es el valor (atributo, conteo o medición) que forma la variable de interés en la unidad
elemental. Los valores que se toma una variable en particular x, se representa con
letras minúsculas acompañadas por subíndice, es decir:
X = ( X 1 , X2 , X 3 ………………… X n )
X i = valor que toma la variable x en la i-esima observación
12
SESIÓN 2
VARIABLES CUALITATIVAS Y CUANTITATIVAS
VARIABLE
VARIABLE CUALITATIVA
Cuando los valores que toma la variable en estudio provienen de una cualidad o
atributo, se divide a su vez en nominal y jerárquica (ordinal).
Ejemplos:
x = color de los ojos de las estudiantes PNP
y= Preferencias a determinadas marcas de jabones de tocados por las
estudiantes femeninas.
z = Sexo de las estudiantes PNP
13
mayor a menor o de menor a mayor. Es decir, de forma descendente o
ascendente.
VARIABLE CUANTITATIVA
Los valores que toma la variable provienen de un conteo o de una medición
instrumento de medida, metro, balanza, cronometro, termómetro, etc). Se
divide a su vez:
14
o Z = Estatura (mts) de las estudiantes PNP.
2.2 PARÁMETRO
Es un valor fijo que caracteriza a la variable de interés en la población en
estudio. Para conocer este valor se requiere tener Todos los datos de la variable
en la población por lo general este valor casi nunca se conoce el objetivo de
investigador es estimarlo a través de una muestra aleatoria. Los parámetros más
usados son:
La media aritmética
La mediana
La Moda
La media Geométrica
La media Armónica
La varianza
La Desviación Estándar
Coeficiente de variación
La media aritmética
La mediana
La Moda
La media Geométrica
La media Armónica
La varianza
La Desviación Estándar
Coeficiente de variación
Ejercicios resueltos
Ejemplo 1
En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que se
dedican a la venta de combustible de un día determinado, se obtiene en
siguiente resultado, el monto de venta diaria promedio de S/. 12 600.50 con esta
información identificar población estadística, unidad elemental, variable en
estudio, tipo de variable, un posible dato, tamaño de la muestra, parámetro y
estimado o valor estadístico.
Solución:
Población estadística : Todos los grifos de Lima Metropolitana, que se
dedican a la venta de combustible.
15
Unidad elemental : Un grifo de Lima Metropolitana, que se dedican
a la venta de combustible.
Variable en estudio : Monto por venta ( s / ) diaria de combustible
Tipo de variable : Variable cuantitativa continua
Dato u observación : S/ 12 600.50
Tamaño de la muestra : 30 grifos
Parámetro : No se conoce el monto promedio por venta
diaria en la población.
Dato estadístico : S/ 12 600.50.
Ejemplo 2
Solución:
Población estadística: Todas las revistas científicas de biología N=2 042
Unidad elemental : Una revista científica de biología
Tamaño de la muestra:50 revista científicas de biología
Ejercicios Propuestos
16
3. Una muestra aleatoria de 550 peruanos mayores de 18 años arroja que el 30%
está de acuerdo con las medidas económicas anunciados por el gobierno hace
uno días.
4. Para analizar la posibilidad de lanzar al mercado una nueva marca de
cigarrillos, se efectuó una encuesta entre fumadores que transitan por la
quinta cuadra de la av. Canadá entre las 5 P.m. y 8 P.m. del día 14 de febrero,
para ello se seleccionó en forma aleatoria a 80 fumadores obteniéndose los
siguientes resultados: el 65% prefiere los cigarrillos importados que los
nacionales y el precio promedio que pagan al comprador una cajetilla es de S/
7.40.
SUMATORIAS SIMPLES
Sea x, una variable en estudio que toma valores x 1 x1 …….xn , la Suma de los valores
x 1 + x 2 +……….+xn , se representa mediante el operador matemático ∑ x i ; que
significa sumar todos los valores x i
i=1
para “i” que toma valores enteros positivos consecutivos desde 1 hasta n, es decir:
n
X 1 + x 2+ ……. x n
∑ xi ;
i=1
Ejemplos:
1. Desarrollar las siguientes sumatorias
11
∑ x 2i + 1 = x 3 + x 5 + …… x11
i=1
6 2 2 2 2
∑ x2 = x 2 + x 4 + ……+ x12
i=1
4
∑ 2x i +1 = 2x 2 + 2x3+ ……… 2x 5
i=1 y 2i+1 y3 y5 y9
Calcular:
4
∑ 2x 2 i + 3 = 2( 7 )2 +3 + 2 (9) 2 + 3 ( 5) 2 +3 + 2 ( 6)2 +3
i=1 xi–2 7-2 9-2 5-2 6-2
4
∑ 2x 2 i + 3 = 20.2 + 23.57 +17.67 + 18.75 = 80.19
17
i=1 xi–2
Tiene por objetivo presentar los datos obtenidos de una población o muestra para
una o más variables en estudio, en tablas de distribución de frecuencias y sus
correspondientes gráficos, con la finalidad de resumir la información para que sea
de fácil interpretación y análisis.
18
La recolección de datos no surge de la nada, estos deben ser recopilados. Para ello
debe tenerse en cuenta la importancia de contar con buenas técnicas de
recolección y precisión para que el margen de error sea mínimo.
Los datos pueden tener cualquier origen, puede ser un conjunto de personas,
animales, plantas, objetos o incluso números correspondientes a mediciones,
dependiendo de dónde se centre el interés del estudio. Independientemente de la
naturaleza de los elementos (entidades) del conjunto de estudio, a la totalidad
suele llamársela población.
2. Entrevistas telefónicas
Las entrevistas telefónicas permiten que los investigadores recolectan más
información en una menor cantidad de tiempo y ahorrando en gastos como el
traslado y el material de las encuestas. Una ventaja de esta herramienta es que
los participantes se sienten más confiados al momento de contestar porque no
están siendo observados.
19
Entre las ventajas de esta herramienta se encuentra el gran alcance que tiene y
la fácil administración de los datos obtenidos. Sin embargo, en muchas
ocasiones, el investigador no tiene el control de la entrevista, además, debe
procurar que sea un proceso corto para que no provoque que el participante no
lo abandone.
3. El cuestionario
Los cuestionarios son una herramienta útil para la recolección de datos. Para
obtener los resultados esperados, es necesario que se realicen
cuidadosamente. Es por eso que antes de redactarlo, es importante que el
investigador defina los objetivos de su investigación.
4. Método de observación
Si lo que prefieres es hacer observación in situ para conocer el comportamiento
de tus clientes, puedes realizarla haciendo uso otras metodologías.
Por ejemplo, en un dispositivo móvil, donde tengas acceso al cuestionario que
hayas creado con los puntos a investigar, e irlo llenando al instante con la
información obtenida durante tu observación.
Debemos tener en cuenta que la manera en que registres la información será
de gran ayuda al momento de analizarla. Poder medir y presentar informes con
datos precisos y reales es muy importante para la correcta toma de decisiones.
5. Encuestas online
Hacer recolección de datos a través de encuestas online tiene grandes ventajas.
Tienes al alcance diversos tipos de preguntas, el uso de variables personalizadas
y lógicas que te permiten obtener mejores resultados y te ayudan a conocer a
profundidad a tus clientes. Los puedes ver en tiempo real para darle
seguimiento a tu investigación; además de generar reportes en diversos
formatos.
Considera también que el hacer recolección de datos a través de encuestas
online, tiene un costo menor que, por ejemplo, hacerlo a través de entrevistas
presenciales, sin olvidar que puedes tener tus resultados en menor tiempo, en
lugar de días, semanas, e incluso meses que es el tiempo que se podría llevar
una recolección de datos a través de entrevistas o el método de observación.
6. Focus group
Un focus group es una forma de estudio cualitativo que consiste en realizar una
reunión donde las personas puedan dialogar o resolver un tema establecido.
Este tipo de debate ayuda a generar ideas, opiniones y actitudes que no se
pueden observar con otro método de recolección de datos.
20
Con este método se puede obtener grandes cantidades de información, ya que
los participantes se sienten confianza para dar su opinión y ofrecer respuestas
honestas y exactas.
Las sesiones de grupo son la herramienta ideal para obtener retroalimentación
de los participantes. Sin embargo, tienen algunas desventajas. Entre las más
importantes se encuentra la falta de control que se tiene durante el debate, lo
que provoca que el tiempo se vaya con temas irrelevantes y complique el
análisis de la información. Esto se puede solucionar con un moderador experto
en el área.
PROBLEMA PROPUESTOS
Edad 7 8 9 10 11 12 13 14 14 15 17 20
fi
02. La escuela cuenta con espacios que permiten la participación en las diversas
actividades que se desarrollan
Masculino: S; S; N; N; S; S; N; N; N; S; S; N; N; N; S; N; N
Femenino: N; N; N; N; N; N; N; N; N; N; N; N; S.
Femenino 100%
Total 100%
03. ¿Qué medidas de bioseguridad estás tomando en cuenta para cuidar tu salud en los
espacios públicos que garantice una participación segura?
21
Lavado de manos: S; S; N; N; N; S; S; N; N; N; N; N; N; N; S; S; S; N; N; N; N; N; N;
S;N; N; N; N; N; N
Distanciamiento social: N; N; N; N; N; N; S; S; N; N; N; S; N; N; S; N; N; N; N; N; N;
N; N; N; N; S; S; N; N; N
Uso de mascarilla: S; S; N; N; N; N; N; S; S; N; N; N; S; N; N; N; S; N; N; N; S; S; N;
N; N; N; S; S; N; N
UNIDAD II
SESIÓN 3
FRECUENCIAS ABSOLUTAS Y RELATIVAS
TITULO
Clas-k
Total
Leyenda:
Fuente :
TITULO
22
Se coloca en la parte superior central de la tabla, el titulo debe ser, claro
preciso, y conciso y guarde relación con la variable que se estudia.
FUENTE
Se coloca en la parte inferior de la tabla y corresponde al nombre de la entidad o
literatura de donde se obtuvo la información, debe incluir la fecha si es posible, si
el mismo investigador es autor de dicha información, debe colocar fuente propia
LEYENDA
Se coloca delante de la fuente y corresponde a una nota o aclaración con
respecto al contenido de la tabla.
CLASE
Se considera clase a una cualidad, un numero o intervalo, las clases para una
tabla de distribución de frecuencia, deben ser mutuamente excluyentes, es decir,
un dato solo puede pertenecer a una determinada clase. Al Numero de clases de
una tabla se le representa por la letra “K”
FRECUENCIA ABSOLUTA
Su valor indica el número de veces que los datos de la muestra caen en una
determinada clase .se representa por fi para una muestra de tamaño “n” y con “
k “ clase se cumple que la sumatoria de todas las frecuencias absolutas es igual
a “n” es decir :
k
∑ fi =n
i=1
Siendo
f i = valor que toma la frecuencia absoluta en la i-esima clase
n = tamaño de la muestra
k= número de clase
FRECUENCIA RELATIVA
Su valor indica la proporción o porcentaje de la muestra contenida en la clase. Se
representa por h i y se obtiene al dividir la frecuencia absoluta por el tamaño de
la muestra, es decir :
h i = f i ( en proporción )
n
h i= f i x 100 % ( en porcentaje )
n
23
En ambos casos se cumple que :
Nota k
∑ f i = h i = 1 o 100%
i=1
F= ∑ f i = i = 1 ,2,…….K
i=1
k
Nota F= ∑ f i = n
i=1
H = F i = 1,2,……….. k
n
Nota: H k = 1 o 100%
El valor de H K nos indica la proporción o porcentaje de datos , menores o
iguales al valor de la i- esima clase
MARCA DE CLASE
El concepto de marca de clase solo se usa cuando se elabora una tabla de
distribución de frecuencias para una variable cuantitativa continua , y su
interpretación matemática corresponde al punto medio para una determinada
clase . Estadísticamente corresponde al valor representativo para todos los datos
que caen en esa clase .Se calcula usando la formula:
24
2
1 Variable fi hi
2 C1 f1 h1
3 C2 f2 h2
K C fk hk
TOTAL N 1
Ejemplo:
Con la finalidad de estudiar la variable x= Preferencia a determinados
Marcas de jabones de tocador por las estudiantes -PNP, se toma una
muestra aleatoria conformada por 30 estudiantes , los resultados son :
Solución:
25
I Jabones de F h h%
tocador
1 Rexona 6 0.2 20%
2 Camay 9 0,3 30%
3 Lux 12 0,4 40%
4 palmolive 3 0,1 10%
Total 30 1.0 100%
FUENTE : PACOCHA S.A
Calcular e interpretar:
f 2 : 9 alumnos encuestados prefieren el jabón de tocador camay
h 2 : 30% de las estudiantes encuestados prefieren el jabón de tocador
Camay
GRAFICA DE BARRAS
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ESTUDIANTES PNP
frecuencia absoluta
f
12
FUENTE 3
PACOCHA
S.A.
rexona camay lux palmolive
GRAFICA CIRCULAR
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ESTUDIANTES PNP
frecuencia absoluta
3
10% 6
26
20%
rexona
camay
lux
12 9
40%
30%
SESIÓN 4
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Y NO AGRUPADOS
Variable F h F H
1 C1 f1 h1 F1 H1
2 C2 f2 h2 F2 H2
K Ck fk hk Fk Hk
Total N 1
FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS
Ejemplo :
Los siguientes datos corresponden a una muestra aleatoria de 50 tiendas
Que se dedican a la venta de gas con la finalidad de analizar la variable
Y= Número de balones de gas vendidos en un día determinado, los
Resultados son :
21 23 24 23 24 21 24 23 24 22 22 24
21 22 24 22 24 25 26 25 24 23 23 21
23 23 22 24 26 26 22 23 22 24 21 25
22 23 25 26 24 22 25 24 25 21 26 23
25 24
Variable F h F H
1 21 6 0,12 6 12
2 22 9 0,18 15 30
3 23 10 0,20 25 50
4 24 13 0,26 38 76
5 25 7 0,14 45 90
6 26 5 0,10 50 100
Total 50 1.00
FUENTE: SOL GAS S.A
Hallar e interpretar:
f 3 = 10 significa que 10 tiendas , tienen una venta de 23 balones de gas
h 3 = 20% significa que el 20% , de las tiendas tienen una venta de 23
balones de gas.
GRAFICA DE BASTONES
13
10
6 9 7 5
0
21 22 23 24 25 26
GRAFICA DE BARRAS
frecuencia
Variable f
25 26
23 24
21 22
13
28
9 10
6 7
5
1 2 3 4 5 6
K Ck fk hk Fk Hk
Total N 1
Ejemplo :
Una muestra aleatoria de tamaño n= 34, es tomada con la finalidad de estudiar
La variable W = peso del recién nacido en la Maternidad de Lima. Los resultados en
kg. Se presentan a continuación.
1.5 1.5 1,9 2.0 2,1 2,1 2.3 2.4 2,5 2,5 2,6
4.1 2.7 2.8 2.9 3,0 3,1 3,1 3,2 3,2 3,2 3,2
3.3 3,3 3.3 3.4 3.4 3,5 3,6 3,6 3,7 3,7 3,9
4.1
FUENTE : Maternidad de Lima
29
a. Calculo de Rango “R”
R = dato mayor – Datos Menor
Para el cálculo de datos se tiene
R= 4.1 – 1.5 = 2,6
Observación.-
El redondeo simple significa, que si un numero tiene como primer decimal
un número mayor o igual a 5 . Entonces la cifra entera del número se
incrementa en una unidad.
Ejemplo
Si, k= 6.7 usando el redondeo simple k= 7
Si k = 6.4 usando el redondeo simple k = 6
i Pesos (kg) fi hi Fi Hi Xi
1 [1,5 -2,0 > 3 0,088 3 0,08 1,75
2 [2,0 -2,5> 5 0,147 8 0,235 2,25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3.0-3,5> 12 0,35 26 0,761 3,25
5 [3,5-4,0> 6 0,176 32 0,931 3,75
30
6 [4,0-4,5] 2 0,058 34 0,989 4,25
34 1.00
H3=41.10% (Significa que el 41.10% de los recién nacidos que tienen un peso
igual o mayor a 1.5 kg , pero menor a 2.0 kg)
H3 – H2= 52.9% (Significa que el 52.9% de los recién nacidos que tienen un peso
igual o mayor a 2.5 kg , pero menor a 3.5 kg)
X´2=2.25 (Significa que 2.25 kg es el peso representativo para los recién nacidos
que tienen un peso mayor o igual 2.0 kg , pero menor a 2.5 kg)
Como 11.6 recién nacidos tienen un peso inferior a 2.8 kg, entonces
→x=
Tiempo 11.6 →
(min) fi hi Fi F*i Hi 11. 6 x
100% =
2–4 3 0,10 3 30 0,10
34.12%
4–6 6 0,20 9 27 0,30 34
6–8 12 0,40 21 21 0,70
8 – 10 7 0,23 28 9 0,93
31
10 – 12 2 0,07 30 2 1,00
Total 30 1,00
Gráficas
GRÁFICA DE BARRAS
12
12
10
7
8 6
6 fi
3
4 2
2
0
02-Abr 4 –6 6 –8 8 – 10 10 – 12
GRÁFICA DE LA OJIVA
Para construir la Ojiva en el eje de la abscisa se colocan los intervalos de clase y en eje
de la ordenada las frecuencias acumuladas absolutas o frecuencias acumuladas
relativas.
Por ejemplo la gráfica de la Ojiva para los pesos de los recién nacidos se obtiene de la
siguiente manera , cero recién nacidos tiene un peso menor a 1.5 kg, 3 recién nacidos
tiene un peso menor a 2 kg, 8 recién nacidos tienen un peso menor a 2.5kg , 14 recién
nacidos tienen un peso menor a 3.0 kg, 26 recién nacidos tienen un peso menor a 3.5
kg, 32 recién nacidos tiene un peso menor a 4.0 kg. y 34 recién nacido tienen un peso
menor a 4,5 kg uniendo estos puntos se obtiene la curva creciente a la derecha
llamada la Ojiva ( “Menor que “)
32
30
25
20
15
10
0 2 4 6 8 10 12 14
Tiempo
(min) fi hi Fi F*i Hi
Total 30 1,00
33
30
25
20
15
10
0 2 4 6 8 10 12 14
GRAFICA DE LA CURVA (MAYOR QUE)
34
Otra metodología para determinar el ancho del intervalo de clase ( C ).
1. Determinación de rango R
R= dato máximo-dato mínimo
2. Determinación de numero de clases K
K= 1+ 3.3 log (n)
3. Determinación de ancho del intervalo de clase ( C )
Ejemplo
La mayor y menor estatura de 50 personas es respectivamente 1.72 mts y 1.55 mts.
Calcular el número de clases y su ancho para construir la tabla de distribución de
frecuencias.
Solución:
1. Determinación de rango R= 1.72-1.55=0.17
2- Determinación de número de clases
K= 1+3.3 log (50)= 6.6= 7 Redondeo por simple
3.-Determinacion de ancho de clase
C= 0.17 = 0,0242 = 0.02
7
Al redondearse se comete error
E= 0.02 * 7 – 0.17 = -0.03
Agregamos una nueva clase k= 8
C= 0.17 = 0.0212 = 0.02
E= 0,02 * 8 – 0,17 = - 0 , 01
Agregamos una nueva marca de clase k= 9
C= 0,17 = 0,0188 = 0,02
9
E = 0.02 * 9 -0.17 = 0.01
35
Los intervalos de clases para esta tabla son :
Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50
Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50
Se observa que las seis primeras clases contienen los datos, la 7ma clase carece de
datos.
Nota:
No existe una formula única para determinar el número de clase (k) en la construcción
de una tabla de distribución de frecuencias. Un número muy pequeño de clases tiende
a ocultar la distribución real del conjunto de datos, mientras que un número muy
grande puede dejar sin observaciones algunas de
Las clases, limitando de esta forma su uso. La idea es tener un numero de clases de tal
forma que todos los datos se encuentren en las clases formadas y además nos permite
conocer la distribución empírica de los datos , Se sugiere que el número de ellos debe
variar entre 5 y 15.
Nota:
Para determinar el número de clases ( k) también se pueden usar otras fórmulas tales
como :
K= Log 2 ( n)
K=√n
Nota:
Para determinar el número de clases para la tabla el investigador puede utilizar algún
criterio sostenido
36
EJEMPLOS DE APLICACIÓN:
Ejemplo de aplicación 1.
Solución:
1 Abandono 2 0.048
2 Aborto 7 0.167
3 Homicidio 7 0.167
4 Maltrato familiar 11 0.262
5 Muerte 12 0.286
6 Suicidio 3 0.071
37
Total 42 1.000
INTERPRETACIÓN
Ejemplo de aplicación 2.
38
a) Construir la tabla de distribución de frecuencia
correspondiente.
b) Interpretar cada una de las frecuencias
Solución:
TOTAL 714 1
FUENTE: Dirección de Investigación Criminal – PNP (Anuario Estadístico 2010)
INTERPRETACIÓN
39
f6 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 26 denuncias por Exposición de
personas a peligro.
40
EJERCICIOS PROPUESTOS
41
UNIDAD III
SESIÓN 5
MEDIDAS DE TENDENCIA CENTRAL
Introducción
En esta unidad se estudia las principales medidas de tendencia central o de posición
central, las cuales se definen como aquellos valores que representan al conjunto de
datos de una variable en estudio. Se presenta el cálculo de las medidas de tendencia
central para datos agrupados, y datos no agrupados, así como también sus
propiedades.
Son valores estadísticos calculados con los datos de la muestra o de la población y que
tienden a ubicarse en el centro de la distribución de los datos.
A estas medidas se les considera como valores representativos para el conjunto de
datos
Si estos valores son calculados usando todos los datos de la muestra, se les llama
valores estadísticos, estadígrafos o estimados; en cambio sí son calculados usando
todos los datos de la población, se les llama parámetros.
Las medidas de tendencia central más usadas son:
1. La media aritmética o simplemente media o promedio
2. La mediana
3. La moda
µ=
Ejemplo:
42
Supongamos que se tienen todos los pesos en kg de 3.546 varones adultos de una
empresa minera, siendo estos:
65,5 70,5 69,5 70,0 71,0 ……………68,5
Hallar su peso promedio e interprete
Por lo tanto 68,2 kg, será el peso promedio para todos los trabajadores de la empresa
es decir el parámetro.
∑ Xi
1
¿
n
.
Es la media aritmética para datos sin agrupar. Al valor de la media aritmética, también
se le conoce como la media aritmética muestral.
Ejemplo
Los siguientes datos corresponden a los pesos (kg) , de 8 personas adultas de sexo
varón:
60,5 68,5 58,5 70,5 70,0 68,5 72,0 71,0
Calcular e interpretar la media aritmética
Interpretación
La media es: 67,4 kg es el peso promedio de 8 varones adultos, por lo tanto este valor
representa a los pesos de los 8 varones; supongamos que los 8 varones adultos son
elegidos al azar de una población de varones adultos, entonces se puede concluir que
el peso promedio de los varones adultos en la población es de 67,4 kg
43
1. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y , la media aritmética,
definimos a una DESVIACIÓN (di)como la diferencia entre un dato xi de la muestra
y su media aritmética ; es decir: di = x i -
=∑
¿¿
i=1
∑ ¿¿
= i=1 es siempre un valor mínimo
3. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y , la media aritmética, sea la
combinación lineal yi = axi ± b; entonces la media aritmética para variable Y es:
=a ±b
4. Sea una muestra de tamaño “n” , dividida en “k” submuestra de tamaño n1, n2……nk ,
y x̄ 1 , x̄ 2 , x̄ 1 , , …¯ … … , x̄ k, la media aritmética de cada submuestra; entonces la media
aritmética de la muestra se calcula por:
x̄
=
A esta medida se le conoce como la media ponderada
LA MEDIA ARIMETICA PARA DATOS AGRUPADOS
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada
clase se le asigna su frecuencia correspondiente.
Cuando los datos se encuentran en una tabla de distribución de frecuencias la media
aritmética se calcula de la siguiente fórmula
k
∑ x 'i f i
= i=1
n
Donde:
K= número de clases
Otra fórmula que se puede utilizar para calcular la media aritmética para datos
agrupados, es en función de las frecuencias relativas
n
=∑ x i hi
'
i=1
44
Nota:
Las propiedades de la media aritmética para datos sin agrupar, se cumplen también
para datos agrupados.
Ejemplo
Sea la tabla para los datos agrupados de los pesos (kg) de los recién nacidos. Hallar e
interpretar la media aritmética:
i Pesos fi hi Fi Hi
=
∑ x 'i f i
=
i=1
n
Interpretación:
La media es 3.029kg es el peso promedio representativo para los recién nacidos de la
maternidad de Lima
VENTAJAS
a. Es fácil de calcular e interpretar su valor
b. La suma de las desviaciones es cero
c. La suma de las desviaciones al cuadrado siempre es mínima
DESVENTAJAS
a. Su valor se encuentra afectado por datos extremos (datos muy altos o datos
muy bajo de lo común); es decir estos datos tienden a alterar su valor
b. Deja de ser un valor representativo para la muestra cuando los datos
presentan mucha variabilidad.
c. No se puede calcular en tabla con extremos abiertos
d. Para datos con distribución asimétrica, no debe usarse como medida
representativa
45
5.3 LA MEDIANA (Me o Md)
La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor. La mediana se puede hallar solo para variables
cuantitativas.
VENTAJAS
1. Es fácil de calcular e interpretar su valor
2. Se realizan manipulaciones algebraicas
3. Su valor no se encuentra afectado por datos extremos
4. Se puede calcular en tablas de distribución de frecuencias con extremos abiertos
DESVENTAJAS
La suma de los cuadrados de las desviaciones con respecto a la mediana no es mínima,
en comparación con la media aritmética
Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadística evaluadas
sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6
Solución:
1) Se ordena los datos de menor a mayor:
2) Se aplica la ecuación:
46
La mediana es el valor de x5 (quinto dato), es decir, Md=8
Ejemplo:
Calcular la mediana de las siguientes calificaciones del curso de Matemática evaluadas
sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solución:
1) Se ordena los datos de menor a mayor:
2) Se aplica la ecuación
Ejemplo:
Dados los siguientes 20 números:
1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5 y 5 x fi
Solución:
Calculando la posición de la mediana se obtiene:
Intervalos f fa
[45,55) 6 6
[55, 65) 10 16
48
[65, 75) 19 35
[75, 85) 11 46
[85, 95) 4 50
EJERCICIOS DESARROLLADOS
Hallar la mediana.
Ejercicio 1. Se tienen los valores:
3 ; 2; 9; 5; 6
Solución: Ordenando
2, 3, 5 , 6. 9
La Me = 5 (Como la cantidad de números es impar, la Mediana es el termino
central=(5+1)/2 =3 el tercer término)
Ejercicio 3.
La cantidad de usuarios que concurren a un centro de información durante la semana
es:
230 220 250 228 240 1200
Hallar el valor de la mediana de la concurrencia de usuarios
Solución: Ordenando
Ordenando los datos en forma ascendente
220 228 230 240 250 1200
49
230+240
Me= =235
2
Interpretación:
Ejercicio 4.
Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 alumnos de la
Escuela de Suboficiales:
1.71 1.69 1.72 1.69 1.68 1.70 1.73
Solución:
Ordenando las estaturas: 1,68 1,69 1,69 1,70 1,71 1,72 1,73
i X fi
1 22 9
2 23 10
3 21 6
4 25 7
5 26 5
6 24 13
50
TOTAL 50
Ordenando los valores que toma la variable X, y obtenemos el valor de las frecuencias
absolutas acumuladas
i X fi Fi
1 21 6 6
2 22 9 15
3 23 10 25(X26X38)
4 24 13
5 25 7 45
6 26 5 50
TOTAL 50
n= 50 ( par) me = x 25 + x 26 = 23 + 24 = 23,5
2 2 2
Interpretación:
El 50% de las tiendas tienen una venta diaria menor o igual a 23,5 balones de gas, y el
otro 50% de las tiendas tienen una venta diaria mayor a 23,5 balones de gas.
Cuando los datos se presentan en una tabla de distribución de frecuencias, para una
variable continua, el valor de la mediana se calcula haciendo uso de la fórmula:
N - F i-1
Me = Li + 2 x C
fi
Donde :
Li = Límite inferior de la clase que contiene al valor de la mediana
F i-1 = Frecuencia acumulada absoluta de la clase anterior a la clase que
Contiene a la mediana
f i = Frecuencia absoluta de la clase que contiene a la mediana
C = Ancho del intervalo de clase .
Fi≥ n ó Hi ≥ 0,5
51
2
Ejemplo:
Hallar e interprete el valor de la mediana para la tabla de datos agrupados de los pesos
de recién nacidos.
i pesos fi hi Fi Hi Xi
1 [1,5 -2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2.25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5] 2 0,058 34 0,997 4,25
34 1,00 100%
n= 34 → n = 17 ≤ F i → i = 4
2
N - F i-1
Me = Li + 2 xC
fi
Me = 3 + 17-14 x 0,5 = 3,125 Kg.
12
Interpretación:
El 50% de los recién nacidos tienen pesos menores a iguales a 3,125 kg. y el otro 50%
de los recién nacidos tienen pesos superiores a 3,125 kg
5.4 LA MODA.
Ejemplo 1.
Hallar la moda para el conjunto de datos:
52
12, 16, 18, 18, 18, 20, 20, 20, 20, 20 , 20 , 24
El dato que se repite con mayor frecuencia es el valor 20, luego la moda es 20.
Ejemplo 2.
Calcular la moda para la serie de datos
1, 1, 2, 3, 3, 4, 7
Ejemplo 3.
Calcular la moda para el conjunto de datos : 4 , 2, 3, 7, 5, 9
Como no existe ningún dato que se repite más de una vez, luego el conjunto de
datos no tiene moda (Amodal).
Ejemplo 4.
Una tienda vende durante el día tres tipos de conservas, 120 frascos con
fresa, 40 frasco con mango y 50 frasco con piña, calcular la moda. En este
ejemplo la variable en estudio es tipo de conservas vendidas, luego los
frascos con fresa registraron la mayor venta, por lo tanto, el frasco con fresa
corresponden a la moda.
Mo = Li + d1 x C
d 1 + d2
Donde :
Ejemplo.
De la tabla de distribución de frecuencia, en la cual se analiza los pesos de los recién
nacidos, Hallar e interprete el valor de la moda.
53
i pesos fi hi Fi Hi Xi
1 [1,5 2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2,25
3 [2,4-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5> 2 0,058 34 0,997 4,25
34 1,00
d 1 = f i– f i - 1 = f 4– f 5 = 12 – 6 = 6
d 2= f i– f i + 1 = f4 – f 5 = 12- 6 = 6
Mo = Li + d1 x A = M 0= 3 + 6 0,5 = 3,25 kg
d1 + d2 6+6
Interpretación : La Moda es: 3,25 kg. Es el peso más frecuente para los recién nacidos.
SESIÓN 6
SESIÓN 7
PRIMERA EVALUACIÓN PARCIAL
54
SESIÓN 8
MEDIDAS DE POSICIÓN NO CENTRAL
CUARTILES
Los Cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales (de 25% cada parte). De manera que para resolver
un problema sobre cuartiles solamente tenemos que hallar Q1; Q2 y Q3.
Los Cuartiles, dividen a la distribución en cuatro partes iguales (tres divisiones).
Q1,Q2,Q3, correspondientes a 25%, 50%,75%.
Pasos a seguir:
1) Ordenar los datos en forma ascendente.
2) Calcular Q2 es decir hallar la Mediana:
Si la cantidad de datos es impar, el valor que está en el centro será la Mediana,
es decir Q2.
Si cantidad de datos es par, se suman los 2 datos centrales y se divide entre
3) Calcular Q1 y Q3.
EJEMPLO:
Cálculo de los cuartiles
55
CASO: NÚMERO IMPAR DE DATOS
Para hallar los tres Cuartiles (Q) para datos agrupados se aplica la siguiente fórmula:
Donde:
Qk : Cuartil
Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Cuartil:
Luego en la Columna "F" escoger el primer valor mayor que la clase cuartil
encontrada.
3. Aplicar la fórmula.
56
EJEMPLOS:
Solución:
Completamos la tabla hallando F:
Cuartil 1:
Cuartil 2:
57
Respuesta: El 50% de empleados tiene 21,7 años de servicio o menos.
Cuartil 3:
DECILES
Los Deciles son los nueve valores de la variable que dividen a un conjunto de datos
ordenados en 10 partes iguales (de 10% cada parte). De manera que para resolver un
problema sobre deciles solamente tenemos que hallar D1; D2 ; D3 ; D4 ; ... D9
Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.
Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.
K . N = 1,2,3,4,5,6,7,8,9
10
58
CASO: NÚMERO IMPAR DE DATOS
6, 8, 7, 2, 3, 5, 4, 6, 2, 6, 10, 8, 11, 1, 2, 5, 5, 1, 12
1, 1, 2, 2, 2, 3, 4, 5, 5, 5, 6, 6, 6, 7, 8, 8, 10, 11, 12
D1 D2 D3 D4 D5 D6 D7 D8 D9
D1 D2 D3 D4 D5 D6 D7 D8 D9
Para hallar los Deciles (D) para datos agrupados se aplica la siguiente fórmula:
Donde:
Dk : Decil
Li: Límite inferior del intervalo seleccionado.
k: Debe ser 1 ; 2 ; 3 ; 4; ... ; 9
n: Número total de datos
f: Frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la clase decil)
a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)
Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Decil:
Luego en la Columna "F" escoger el primer valor mayor que la clase Decil encontrada.
3. Aplicar la fórmula.
59
EJEMPLOS:
1. La tabla muestra el peso (en Kg) de los estudiantes de la del “Primer año de la
Escuela Técnica de la PNP”, calcula e interpreta los cuatro primeros Deciles:
Solución:
Completamos la tabla hallando F:
Encontramos la clase Decil y seleccionamos el intervalo del cual tomaremos los datos.
Decil 1:
Decil 2:
Decil 3:
60
Respuesta: El 30% de los estudiantes tiene 70,94 Kg de peso o menos.
Decil 4:
PERCENTILES
Los Percentiles son los 99 valores de la variable que dividen a un conjunto de datos
ordenados en 100 partes iguales (de 1% cada parte). De manera que para resolver
un problema sobre percentiles solamente tenemos que hallar P1; P2 ; P3 ; P4; ... ;
P99
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante. El 60 percentil, es aquel valor de la variable
que supera al 60% de las observaciones y es superado por el 40% de las
observaciones. El percentil 99 supera 99% de los datos y es superado a su vez por el
1% restante.
NOTA: Para hallar los Percentiles se sigue el mismo procedimiento que los Cuartiles.
Para hallar los Percentiles (P) para datos agrupados se aplica la siguiente fórmula:
61
Donde:
Pk : Percentil
Li: Límite inferior del intervalo seleccionado.
k : Debe ser 1 ; 2 ; 3 ; 4; 5 ; ... ; 99
n: Número total de datos
f : frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la Clase Percentil)
a : Amplitud del intervalo (Restar los 2 valores: L sup - L inf)
Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Percentil:
Luego en la Columna "F" escoger el primer valor mayor que la clase Percentil
encontrada.
3. Aplicar la fórmula
EJEMPLOS:
1. La tabla muestra el consumo semanal de fruta de los pacientes de un hospital,
Calcula e interpreta el Percentil 60 y 90.
Solución:
Completamos la tabla hallando F:
Encontramos las Clase Percentil y seleccionamos el intervalo del cual tomaremos los
datos.
62
Percentil 60:
Percentil 90:
63
Sueldos f1
900 – 1200 11
1200 - 1500 13
1500 – 1800 20
1800 – 2100 17
2100 – 2400 15
2400 – 2700 3
2700 - 3000 1
Talla N° de
participantes
1.60 – 1.65 17
1.65 – 1.70 20
1.70 – 1.75 3
1.75 – 1.80 10
1.80 - 1.85 5
Notas (x) fi Fi
Li−Ls
10 - 12 14
12 - 14 33
14 - 16 9
16 - 18 1
4. Hallar e Interpretar: Los Q2, D7 y P90 del siguiente estudio que se ha realizado
de
“Robo a banco y entidades financieras 2000 -2011”
Años fi
2000 - 2002 4
2002 – 2004 6
2004 – 2006 6
2006 – 2008 15
2008 – 2010 28
2010 - 2011 31
64
SESIÓN 9
MEDIDAS DE DISPERSIÓN O VARIABILIDAD
Si los datos son muy semejantes entre sí, podremos observar que no se encuentran muy
dispersos con respecto a la media; es decir los datos no son muy variables; sin embargo,
cuando los datos presentan diferencias importantes entre sí, apreciaremos que tienden a
dispersarse, y de este modo, la información resulta variable o heterogénea. De otro lado, si los
datos fuesen iguales, se dice que no existe variabilidad o dispersión entre ellos
El estudio del grado de variabilidad de los datos que se han recogido es muy importante en
todo análisis estadístico, porqué de éste depende el grado de confiabilidad de las estimaciones
que podamos establecer.
DEFINICIÓN
Las medidas de dispersión son un conjunto de valores que tienen por objeto proporcionar en
un valor único, información sobre la variabilidad que presenta la población o la muestra con
respecto a la variable de interés.
Ejemplo: Supongamos que dos estudiantes han realizado cinco exámenes cada uno. Para
evaluarlos elegimos calcular la media de las cinco notas que han obtenido. Las notas han sido:
Notas Media
Estudiante N°01: 14, 15, 15, 15, 16. 15
Estudiante N 02: 11, 12, 15, 18, 19. 15
Si observamos la media de los dos estudiantes tendrían la misma nota (15), lo que nos haría
pensar que los dos estudiantes son similares, pero si observamos sus notas hay una gran
diferencia entre ambos:
El estudiante N°01 tiene unas notas muy homogéneas, muy próximas a la media, mientras que
el estudiante N°02 tiene notas muy dispares.
Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos mida esa
variabilidad. Nos referimos a las medidas de dispersión.
65
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad
de los datos, si la distribución de los datos es más o menos homogénea y por tanto nos dan
una medida sobre la representatividad de los parámetros de centralización (moda, mediana o
media).
En otras palabras, las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de
manera resumida una característica de la variable estudiada. En este sentido, deben
acompañar a las medidas de tendencia central. Juntas ofrecen información de un sólo vistazo
que luego podremos utilizar para comparar y, si fuera preciso, tomar decisiones.
Podemos decir finalmente que las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución; las medidas de dispersión nos permiten tener la
posibilidad de establecer comparaciones de diferentes muestras.
Estas medidas de dispersión son relaciones entre medidas de dispersión absoluta y medidas de
tendencia central, las cuales vienen expresadas en valores proporcionales o porcentuales y
tienen como función determinar entre varias distribuciones la de mayor o menor dispersión; es
decir, Heterogeneidad u homogeneidad entre dos series de datos.
a. Coeficiente de Variación.
Max (X): Es el máximo valor que toma la variable X en los datos recogidos.
Mín (x ):Es el mínimo valor que toma la variable X en los datos recogidos.
66
Características:
17, 18, 18, 18, 23, 15, 25, 18, 20, 17, 35.
Rango = 20
Ejemplo 02
67
AÑOS VENTAS
1 4239
2 6674
3 7714
4 4121
5 9391
6 6648
7 9048
8 5717
9 3623
10 3433
11 3156
12 8686
13 3805
14 6828
15 1895
16 7468
17 9947
18 8941
19 8065
20 8680
68
b. RANGO INTERCUARTÍLICO
El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de la dispersión
de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango
intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es
la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos).
IQR = Q3 – Q1
Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución normal o
campana de Gauss) es más apropiado medir la tendencia central y la dispersión mediante la
mediana y el rango intercuartil respectivamente que con la media aritmética y la desviación
típica.
Ejemplo 01
Para el cálculo de un rango intercuartílico, consideraremos el conjunto de datos:
2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9
Q1 = (3 +4)/2 Q3 = (8 +8)/2
M
Mínimo =2
Q1 = 3,5
Mediana =6
Q3 =8
Máximo =9
IQR = Q3 – Q1
IQR = 8 – 3,5
IQR = 4,5.
69
Ejemplo 02
Hallar el rango intercuartil de la siguiente muestra que está constituida por las edades de 15
personas detenidas en esta última semana, en la Comisaría Sol de Oro:
25 17 19 28 26
27 20 18 26 12
18 28 16 30 22
12 16 17 18 18
19 20 22 25 26
26 27 28 28 30
Q1 = Percentil 25
25
i=( )(15)
100
i = (0 . 25)(15)
i = 3.75 => 4
Q1 se encuentra en la Posición 4
Q1= 18
Q3 = Percentil 75
75
i=( )(15)
100
i = (0.75)(15)
i = 11.25 => 12
Q3 se encuentra en la Posición 12
Q3= 27
70
Por lo tanto:
IQR = Q3 – Q1
IQR = 27 – 18
IQR = 9
c. DESVIACIÓN MEDIA
Es el valor promedio de los desvíos tomados en valor absoluto, de los datos con respecto a un
término central. El término central en la práctica es la media aritmética, pero también puede
usarse la mediana, la moda o un valor arbitrario, dependiendo de los datos estudiados. Para el
cálculo de la desviación media se utilizará las siguientes fórmulas:
N
Características:
Desventajas
Ejercicio 01
71
Empezamos calculando la media aritmética de los datos, teniendo en cuenta que tenemos 4
datos (n = 4)
Ejercicio 02
Cálculo de la Media:
672
X= =11.2
60
∑|X i− X|f i
DM = i =1
N
144.6
DM = =2.41
60
EJERCICIOS PROPUESTOS
Ejercicio 01
72
Se tiene los años de servicio en la PNP de los servidores administrativos; 2, 2, 4, 4,4, 5, 6, 7, 8,
8. Calcular la desviación media de estos valores.
X x−x |x−x|
2
x=
CÁLCULO DE LA DESVIACIÓN MEDIA
DM =
Ejercicio 02
Hallar la desviación media de la siguiente tabla referida a las edades de los miembros de la PNP
en el departamento de ICA
Clase fi
16-20 2
20-24 8
24-28 8
28-32 18
32-36 20
73
36-40 18
40-44 15
44-48 8
48-52 3
Clase fi xm fi xm
|x−x| fi |x−x|
16 - 20 2
20 - 24 8
24 - 28 8
28 - 32 18
32 - 36 20
36 - 40 18
40 - 44 15
44 - 48 8
48 - 52 3
x=
CÁLCULO DE LA DEVIACIÓN MEDIA
DM =
Ejercicio 03
74
Según cuadro; a los trabajadores de la PNP de la Ciudad de Satipo, le asignaron viáticos por
trabajo de campo en los pueblos cercanos, en el mes de julio del 2011.
440 - 460 8
460 - 480 11
480 - 500 10
500 - 520 16
520 - 540 39
540 - 560 40
560 - 580 23
580 - 600 13
600 - 620 9
620 - 640 1
TOTAL
Calcular:
Media=
DESVIACION MEDIA =
Ejercicio 04
Los resultados siguientes representan las calificaciones del examen final del curso de
análisis estadístico en la PNP.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 95 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
HALLAR:
75
b) DESVIACIÓN MEDIA
76
SESIÓN 10
DESVIACIÓN ESTÁNDAR, VARIANZA COEFICIENTE DE VARIACIÓN
d. DESVIACIÓN ESTÁNDAR
Es una medida de dispersión para variables con razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
En otras palabras, es una medida del grado de dispersión de los datos respecto al valor
promedio. La Desviación Estándar es simplemente el “promedio” o variación esperada con
respecto a la media aritmética. Para el cálculo de la desviación estándar se utilizará la siguiente
fórmula:
Características:
Utilidad:
Su utilidad radica en la transmisión de cuánto tienden a alejarse los valores concretos del
promedio en una distribución. De hecho, específicamente, el cuadrado de la desviación
estándar es “el promedio del cuadrado de la distancia de cada punto respecto del promedio”.
Se suele representar por una S o con la letra sigma.
Ejemplo:
σ2 = 16 / 6 2,67
77
Desviación estándar: σ = √ 2,67 1,63
e. VARIANZA
Varianza poblacional:
[ ]
N N N
1
1
σ = ∑ (x i−μ)2
2
N i=1
=
N
∑ x i −N μ = N1 ∑ x i2−μ 2
2 2
i=1 i =1
Varianza muestral:
[ ]
n n
1 1 1
S2 = ∑ ( x −x)2
n−1 i=1 i
=
n−1
∑ x 2i −n ( x )2 =
n−1
¿
i=1
Característica:
Utilidad:
Ejemplo
78
Para la serie de números x 1=2, x2=3, x3=6, x4=8, x5=11 con n=5=N tenemos los siguientes
cálculos.
Media:
Desviación media:
Varianza:
Desviación estándar:
Datos no agrupados:
A la media aritmética de los cuadrados de las desviaciones se le llama varianza, se denota por
σ2 y se calcula: Varianza poblacional = Suma de los cuadrados de las desviaciones / Número de
datos
Para datos no agrupados utilizaremos la fórmula antes definida:
2 1
S= ¿
n−1
Ejercicio 01
Asumamos que las utilidades netas (en millones de soles) correspondientes a 40 empresas
elegidas al azar fueron las siguientes:
3.5 4.6 8.8 3.4 -2.3 6.1 -4.6 2.6 3.8 12.6
2.1 4.1 3.2 -4.2 2.4 -6.8 5.0 -3.3 -2.2 2.4
3.7 1.8 3.6 -4.5 2.9 3.3 -0.4 4.2 -0.8 -2.5
3.1 9.1 2.6 4.3 -0.9 2.1 1.6 8.1 5.6 10.7
79
Determinando el Rango: R = X máx – X min
40
1 2
¿S=
n−1
[ ]
2
2 1 98.8
S= 944.66− =17.96
40−1 40
Datos agrupados:
Σ es el símbolo de sumatoria,
Cuanto mayor sea la varianza, más dispersos se encontrarán los datos con respecto a su
media aritmética.
Ejercicio 01
80
cuadernos días (fc) (Pm)
vendidos
5 a 10 3 7.5 7.5 ‒ 17.5 = ‒10 (‒10) 2 = 100 3(100) = 300
10 a 15 7 12.5 ‒5 25 175
15 a 20 10 17.5 0 0 0
20 a 25 8 22.5 5 25 200
25 a 30 1 27.5 10 100 100
30 a 35 1 32.5 15 225 225
Total 30 1000
1000
Varianza= =33.33
30
EJERCICIO PROPUESTO
Ejercicio 01
Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a
una comisaría, encontrando:
Policías 0 1 2 3 4 5 6 7 8
Frecuencias 5 19 29 30 22 16 14 9 6
a. COEFICIENTE DE VARIACIÓN
σ
Coeficiente de Variabilidad poblacional: CV = (100 %)
μ
S
Coeficiente de Variabilidad muestral: CV = (100 %)
X
Características:
81
El coeficiente de variación no se puede definir si la media es igual o próximo a cero.
Si la media es un valor negativo, debe considerarse su valor absoluto para evaluar el
coeficiente de variación.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas
distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Utilidad:
CV Grado de variabilidad
0 ≤ CV <10 Datos muy homogéneos
10 ≤CV <15 Datos regularmente homogéneos
15 ≤CV <20 Datos regularmente variables
20 ≤ CV <25 Datos variables
CV ≥ 25 Datos muy variables
Si las unidades de medida de las observaciones de dos o más conjuntos de datos son las
mismas y sus promedios son iguales o semejantes, se debe utilizar la varianza o desviación
estándar.
Si las unidades de medida de las observaciones de dos o más conjuntos de datos son
diferentes o si sus promedios son diferentes, se debe utilizar el coeficiente de variación.
Ejercicio 01
Una muestra de estudiantes de la EESTP-PNP, San Bartolo tiene una estatura media de 160 cm
con una desviación estándar de 16 cm. Estas mismas estudiantes, tienen un peso medio de 70
kg con una desviación estándar de 14 kg. ¿Cuál de las 2 variables presenta mayor variabilidad
relativa?
82
Estatura (E) Peso (P)
sE sP
CV E = CV P =
XE XP
16 14
CV E = =0.1 CV P = =0.2
160 70
CV E =10 % CV P =20 %
Podemos observar que CVP > CVE, por lo tanto, llegamos a la conclusión, que el peso de esta
muestra de estudiantes tiene mayor variabilidad relativa que la estatura
Ejercicio 02
Peso (kg.) fi
60 - 63 5
63 - 66 18
66 - 69 42
69 - 72 27
72 - 75 8
100
Paso 1: Completamos la tabla con la información requerida para calcular la varianza.
Peso 2
(kg.)
fi Xi Xi*fi Xi2 *fi ( X i−X ) f i
60 - 63 5 61.5 307.5 18911.25 208.0125
63 - 66 18 64.5 1161.0 74884.50 214.2450
66 - 69 42 67.5 2835.0 191362.50 8.5050
69 - 72 27 70.5 1903.5 134196.75 175.5675
72 - 75 8 73.5 588.0 43218.00 246.4200
100 6795.0 462573.00 852.7500
Cálculo de la media:
83
[ ]
n
1
X= ∑ X f =¿ 6795
n i=1 i i 100
=67.95 ¿
( )
n 2
[∑ ] ∑ xi f i
n n
1 1
s2= ∑ (x −x )2 f i = 2
xi f i −n x
2
= 1
n
n i=1 i n i=1 ∑ x2 f −
n i=1 i i
i=1
n
( )
n 2
1
n ∑ xi f i
s = ∑ xi f i−
2 2 i=1
n i=1 n
( )
2
2 1 ( 6795
s= 462573 )− =8.5275
100 100
s= √ 8.5275=2.92
s
CV =
x
2.92
CV = =0.0430=4.3 %
67.95
Ejercicios propuestos
Ejercicio 01
Se efectúa un estudio para analizar los tiempos de espera en segundos, de los clientes de un
banco regional, para ello se registran dos situaciones: cuando hacen una fila única y cuando
hacen filas individuales ante las ventanillas de atención. Los resultados son los siguientes:
Fila única 390 396 402 408 426 438 444 462 462 462
Filas individuales 252 324 348 372 402 462 462 510 558 600
Ejercicio 02
Una encuesta realizada a una muestra de alumnos de la EESTP-San Bartolo para conocer el
número de horas que navegan semanalmente en internet, arrojó los datos de la tabla. Calcular
el coeficiente de variación.
84
Frecue
Horas ncia
fi
[ 0 - 10) 2
[10 - 20) 3
[20 - 30) 3
[30 - 40) 7
[40 - 50] 5
EJERCICIOS PROPUESTOS
Ejercicio 01
EDADES FRECUEN
CIA
[ 20; 25 > 2
[ 25; 30 > 5
[ 30; 35 > 2
[ 35; 40 ] 1
Ejercicio 02
En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan
anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos:
INTERVALOS FRECUENCIA
[ 20; 40 > 10
[ 40; 60 > 30
[ 60; 80 > 20
[ 80; 100 > 20
[ 100; 120 ] 20
Ejercicio 03
85
a) Calcular las medidas de dispersión.
Ejercicio 04
Ejercicio 05
Intervalo 0a 10 a 20 a 30 a 40 a 50 a 60 a
10 20 30 40 50 60 70
Frecuenci 8 34 76 60 31 28 13
a
Ejercicio 06
Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a
una comisaría, encontrando:
Policías 0 1 2 3 4 5 6 7 8
Frecuencia 5 19 29 30 22 16 14 9 6
s
Ejercicio 07
Estatura 60 a 63 a 66 a 69 a 72 a
62 65 68 71 74
Frecuencia 5 18 42 27 8
Ejercicio 08
Valor 0 1 2 3 4 5 6 7
86
Frecuencia 8 14 25 13 20 12 6 2
GUÍA DE RESPUESTAS
1.-En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y
cantidades se especifican en el siguiente cuadro:
SOLUCION
SOLUCION DE MEDIDAS
DE MEDIDAS DE DISPERSION
DE DISPERSION
Ejercicio
Hallar la N° 01:y la desviación típica.
varianza
1.-En
1.-En una una redada
redada en el distrito
en el distrito de Chorrillos
de Chorrillos se se logró
logró capturar avezados
capturar avezados delincuentes
delincuentescuyas edades
cuyas y
edades y
cantidades
cantidades se especifican
se especifican en elen
Frecuencia el siguiente
siguiente Marcacuadro:
cuadro:de Frecuencia _ _ _
Edades fi*Xi Xi X ( X i X ) 2 ( X i X )2 * fi
Hallar laHallar la varianza
varianza
fi típica.
y la desviación
y la desviación
clase
típica. Xi Acumulada
[20 - 25> 2 22.5 45.00 2 -6 36 72
[25 - 30> 5 27.5 137.50 7 -1 1 5
[30 - 35> 2 32.5 65.00 9 _
X iXi X4_
X ( X i( X X
_
) 216( X2 X
_ _
) 2 *f iX 32
_
i X ) i (X i )2 * fi
[35[20
- 40] [20 - 25>
- 25> 12 2 37.5
22.5
22.5 37.50
45.00
45.00 210
2 -6 -69 36 36 81 72 7281
[25 - [25 - 30>
30> 105 5 27.5
27.5 285.00
137.50
137.50 77 -1 -1 1 1 5 5190
[30 - [30 - 35>
35> 2 2 32.5
32.5 65.00
65.00 99 4 4 16 16 32 32
[35 - [35 - 40]
40] 1 1 37.5
37.5 37.50
37.50 10
10 9 9 81 81 81 81
Media = 28.5
10 10 285.00
285.00 190 190
MediaMedia
= = 28.5
28.5
Varianza = 19
Varianza
Varianza = = 1919
Desviación típica = 4.36
Desviación
Desviación típicatípica
= = 4.36
4.36
2.- En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el
Ejercicio
2.- En N°
campo.
campo.
un
Halla 02:
2.-estudio
En un estudio
laslas
campo.
Halla Halla
medidas
estadístico
estadístico
medidas dede
se analizó
se analizó
dispersión,
las medidas
dispersión,
la cantidad
la cantidad
según
de dispersión,
según los
según
dedebalas
balasque
siguientes
loslos
que los
los efectivos
siguientesdatos
siguientes
efectivospoliciales
enel
datos en
datos en
policiales
elcuadro
el cuadro
cuadro dado.
dado.
dado.
utilizan anualmente
utilizan en el en el
anualmente
fi*Xi X iX X _ ( X i(
XX ) 2 ( X_2i X ) 2 * f i | 2X_ X | * fi _
i X
INTERVALOS
i X )
(X i X ) * fi
i
| X i X | *_ f i
fi clase Xi Acumulada
Xi X (X i X )2 ( X i X ) * fi
2 | X i X | * fi
[ 20; 40 > 10 30 300 10 -42 1764 17640 420
[ 40; 60 > 30 50 1500 40 -22 484 14520 660
[ 60; 80 > 20 70 1400 60 -2 4 80 40
[ 80; 100 > 20 90 1800 80 18 324 6480 360
[ 100; 120 ] 20 110 2200 100 38 1444 28880 760
100 7200 67600 2240
100 7200 67600 2240
Varianza = 676
Varianza = 676
Media =Desviación típica = 72
26.00
Desviación típica = 26.00
Media
Varianza = lasdedesviaciones
las desviaciones medias = 22.40
Media de medias 676
= 22.40
3.- Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
Desviación
3.- Se reporta típica
la cantidad de =
libros leídos en un
0 3 0 1 0 1
26.00
mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
0 3 0 1 0 1
1 1 2 1 1
1 1 2 1 1
Media de las 4 2 3 3 medias 2
4 desviaciones
2 3 3 2 = 22.40
Ejercicio N° 03: 2 1
2 1 1 2 1
1 2 1
Calcula las medidas de dispersión.
3.- Calcula
Se reporta la cantidad
las medidas de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
de dispersión.
0 3 0 1 0 1
Frecuencia
#1de Libros
1 2 Frecuencia
1 1 _ _ _
Xi fi*Xi X i X _ ( X i X ) 2 (_X2i X ) 2 * f i _| 2X X | | X* f
_
fi Acumulada Xi X
i i
X
_
4 2 3 3 2 (X i X ) ( X i X ) * fi i | * fi
Media = 1.52
Media = 1.52
Varianza = 1.1066
Varianza = 1.1066
Desviación típica = 1.05
Desviación típica = 1.05
Media de las desviaciones medias = 0.88435
Media de las desviaciones
21 medias = 0.88435
4.- Los siguientes datos representan 32
el peso de 4 capitanes 23.2381
de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. 18.57
4.- Los siguientes datos representan
Calcular la varianza eltípica.
y la desviación peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80 .
Calcular la varianza y la desviación típica.
Ejercicio N° 04: _ _ _
Media = 1.52 X i X _ ( X i X ) 2 (_X2i X ) 2 * f i _ 2
Xi X (X i X ) ( X i X ) * fi
Varianza = 1.1066
A 1 64 64 1 -6 36 36
B 1 70 70 2 0 0 0
C 1 66 66 3 -4 16 16
D 4 1 80
280 80 4 10 100 100
152
4 280 152
4 280 152
Media = 70
Media = 70
Varianza = 38
Varianza = =
Media 3870
Desviación típica = 6.16
Varianza
Desviación = =
típica 6.1638
5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:
Desviación típica = 6.16
Ejercicio N° la05:
5.- Calcular varianza y la desviación típica de la siguiente distribución de frecuencias:
X i X
_
(X i X )2
_
( X i X )2* fi
_
[ 0; 10 > 8 5 40 8
Xi X
-28.32
( X i X ) 2 ( X i X )2 * fi
802.02 6416.18
[ 10; 20 > 34 250
15 510 8330
42 -18.32 335.62 11411.16
53694.40
[ 20; 30 > 76 25 1900 118 -8.32 69.22 5260.90
[ 30; 40 > Media60
= 35 2100
33.32 178 1.68 2.82 169.34
[ 40; 50 > 31 45 1395 209 11.68 136.42 4229.09
Varianza = 214.78
[ 50; 60 > 28 55 1540 237 21.68 470.02 13160.63
[ 60; 70 ] 13 típica =
Desviación 65 845
14.66 250 31.68 1003.62 13047.09
250 8330 53694.40
250 8330 53694.40
6.- Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
Determine la varianza, la desviación típica y la media de las desviaciones medias.
Media =Media = 33.32
33.32
Varianza =
Varianza = 214.78
214.78 Xi X
_
(X X )2
_
( X i X )2* fi
_
| X X
_
| * fi
i i
Desviación
Desviación típica típica
= = 14.66
14.66
6.- Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
Ejercicio N°
6.- Durante 06:periodo
un
Determine
de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
la varianza, la desviación típica y la media de las desviaciones medias.
Determine la varianza, la desviación típica y la media de las desviaciones medias.
150 530 4.20 613.33 252.53
Frecuencia Frecuencia _ _ _
Policias
Media = Xi fi*Xi
3.53 Xi X (X i X )2 ( X_ i X ) 2 * f i
_
fi Acumulada _ | _X i X | * fi
X X ( X i X )2* fi
_
i (X X )2 | X X | * fi
0Varianza = 5 0 4.090 5 -3.53 12.48i 62.42 17.67 i
Xi X (X i X )2 ( X i X )2* fi | X i X
|* f i
Media = 3.53
Desviación
Varianza = típica = 2.02
4.09
100 6745 852.75 226.50
Media
Desviación de las=desviaciones medias
típica 2.02= 1.68356
Media = 67.45
Media de las desviaciones medias = 1.68356
Varianza = 8.53
Xi X (X i X )2 ( X i X )2 * fi | X i X | * fi
_ _ _ _
X i _ X (X X_ ) 2 ( X i X )_2 * f i | X i X | *_ f i
Xi X ( X i X )2* fi
i
(X i X )2 | X i X | * fi
Varianza = 8.53 88
Media = 2.93
Media de Desviación
las desviaciones típica =
absolutas = 2.27 1.75
Varianza = 8.53
Media de las desviaciones absolutas = 1.47
Media = 3.53
Varianza = 4.09
7.- La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de alumnos:
Desviación típica = 2.02
Determine el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.
Media de las desviaciones medias = 1.68356
[ 60;se
7.- La siguiente tabla 62refiere
] a las5 estaturas en
61 pulgadas,305
de un grupo5de alumnos:-6.45 41.60 208.01 32.25
[ 63; 65 ] 18 64 1152 23 -3.45 11.90 214.25 62.10
Determine el rango, la media de las
[ 66; 68 ] 42
desviaciones
67
absolutas,
2814
la varianza65
y la desviación
-0.45
típica. 0.20 8.51 18.90
[ 69; 71 ] 27 70 1890 92 2.55 6.50 175.57 68.85
[ 72; 74 ] 8 73 584 100 5.55 30.80 _
246.42 44.40
_ _ _
100 6745 Xi X (X i
( X i X ) 2 * f226.50
X ) 2 852.75 i
| X i X | * fi
Rango = 14
Media = 67.45
Media
Media de =
las desviaciones absolutas = 67.45
2.27
Varianza = 8.53
Ejercicio
8.- DadaN° 08: tabla de frecuencias, para datos sin agrupar:
la siguiente
X X
_ _ _
( X i X ) 2 ( X i X )2 * fi | X i
_
X | * fi
Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.
i
Frecuencia Frecuencia _ _ _
Valor Xi fi*Xi Xi X (X X )2 ( X i X )2 * fi | X
_
X | * fi
fi Acumulada i
i
SESIÓN 11
PRACTICAS DIRIGIDAS – REPASO
SESIÓN 12
89
SESIÓN 13
SESIÓN 14
UNIDAD IV
PROBABILIDADES
INTRODUCCIÒN
Ejemplo:
ESPACIO MUESTRAL ( ).
aleatorio. Ejemplos:
90
1= {1;2;3;4;5;6} entonces 𝑛() = 6
2. ¿Cuál será el espacio muestral de un experimento de lanzar una moneda dos veces?
EVENTOS O SUCESOS:
Ejemplo
Observación
Podemos expresar las posibilidades de que ocurra un suceso usando un número comprendido
entre 0 y 1. En esta escala, el 0 representa un suceso imposible y 1 representa un suceso que
ocurrirá, con certeza. Podemos escribir P(A) para representar la probabilidad de que ocurra un
suceso A.
0≤ 𝑃(𝐴) ≤ 1
LA PROBABILIDAD DE UN SUCESO
según Laplace es la razón entre el número de casos favorables y el número total de casos
posibles.
𝑃(𝐴) = n(A)
n(𝑈)
Donde (𝐴):número de casos favorables
𝑃(𝐴𝑐) = 1 − 𝑃(𝐴)
Observación
𝑛𝑥𝑃 veces
Ejemplo 1:
91
Se arroja un dado equilibrado con 20 caras numeradas del 1 al 20. El suceso A se define como
“el número obtenido es un múltiplo de 4”.
a) (𝐴) = 5 𝑦 𝑛(𝑈) = 20
𝑃(𝐴) = n(A) = 5 = 1
𝑛(𝑈) 20 4
b) 1 𝑥100 = 25
4
4
Ejemplo 2.
Solución
= 𝑛(𝑈) == 1;2;3;4;5;6
𝑛(A) = 3
𝑛(𝑈) = 6
P(A) = 3 = 1 = 50%
6 2
Ejemplo propuesto.
a) Dos caras
b) Al menos dos caras
c) A lo más dos caras
92
TEOREMA DE PROBABILIDAD
INTERSECCIÓN DE SUCESOS
Ejemplo:
A=Basquetbol B= Futbol
100
14 16 22
48
16 4
P ( A ∩B )= =
100 25
22 11
P ( B ∩ A )=
c
=
100 50
93
UNIÓN DE SUCESOS
Ejemplo
De los 100 estudiantes, 30 juegan bádminton. De ellos, 16 practican ambos: tiro con arco y
bádminton.
Solución
P(A𝖴B)= ?
n( A ∪ B) 52 13
P ( A ∪ B )= = =
n(U ) 100 25
n( A ∪ Bc ) 86 43
( c
P A ∩B =) = =
n(U ) 100 50
94
TEOREMA DE LA MULTIPLICACION
Ejemplo
1. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente y sin
reposición. Calcular la probabilidad que la primera sea blanca y la segunda azul.
Solución
4 6 4
= x
10 9 15
PRINCIPIOS DE CONTEO
A B
#(A) = m
#(A B) = m + n, si A B =
#(B) = n
95
Generalización: Si los eventos A i ocurren de ni maneras, i = 1, 2, ……k, ,
respectivamente, entonces el evento ¿ i=1 ¿ k A i ocurrirá de n1 + n2 + ……..+ nk
maneras, siempre que estos eventos sean mutuamente excluyentes.
Ejemplo 10:
Sea = { 1, 2,3, 4, 5, 6} un Espacio Muestral que resulta del experimento aleatorio de
lanzar un dado sobre una mesa. Y sean los eventos A = { 1, 3 } y B = { 2, 4, 6 }.
El evento A ocurre de dos maneras (ocurre cuando sale 1 ó 3 ) y el evento B ocurre de
tres maneras (ocurre cuando sale 2, 4 ó 6); entonces, como los eventos son
mutuamente excluyentes, el evento A ó B ocurrirá de 2 + 3 = 5 maneras (ocurrirá si
sale 1, 3, 2, 4 ó 6).
Analogía Matemática: El conjunto A tiene 2 elementos y el conjunto B tiene 3
elementos como A B = , el conjunto A B tendrá 2 + 3 = 5 elementos; en efecto,
A B = {1,2,3,4,6} tiene 5 elementos.
Ejemplo 11:
Existen 3 caminos (u opciones) diferentes para ir de la ciudad P a la ciudad Q y existen
4 caminos (u opciones) diferentes para ir de Q a R. ¿De cuantas rutas diferentes se
dispone para ir de P a R?
96
Observando la figura y por el segundo Principio de Conteo, disponemos de 3 x 4 = 12
puede efectuarse de 4 maneras (4 rutas para ir de Q a R), entonces las dos operaciones
Ejemplo 12
Un experimento Aleatorio consiste en lanzar un dado dos veces y que los eventos
sean:
A = {En el primer lanzamiento resulte impar}
B = {En el segundo lanzamiento resulte par}
C = {Que en el primer lanzamiento resulte impar y en el segundo resulta par}
¿De cuantas maneras ocurrirá el evento C?
Solución:
A = {1, 3, 5}, B = {2, 4, 6} El evento C ocurrirá de 3 x 3 = 9 maneras (segundo
principio de conteo).
Por la Analogía Matemática: A x B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6), (5, 2), (5,
4), (5, 6)}. Tiene 9 elementos. Son las nueve maneras de ocurrencia del evento C.
97
EJERCICIOS DESARROLLADOS
Solución
= 1,2,3,4,5,6
A = 2,3,5
Solución:
Para que sea múltiplo de 3, la suma debe ser 3,6,9 o 12, siendo los casos favorables de 2,5,4 y
1 respectivamente, que en total hacen 2+5+4+1, igual a 12 casos favorables, con respecto a 36
casos en total.
12 1
=
36 3
Solución:
4 1
=
52 13
4. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente,
con reposición. Calcular la probabilidad que la primera sea azul y la segunda blanca.
Solución:
98
P(a y b) = P(a) x P(b)
6 4 6
x =
= 10 10 25
5. De una caja que contiene 5 bolas rojas y 3 negras, se extrae uno de ellos al azar.
Determinar la probabilidad que sea negra.
Solución
n () = 8
Solución:
Como en un mazo de 52 cartas hay 13 espadas, por el método de las combinaciones, tenemos
que:
1
13 52
La probabilidad será: C 2 /C 2 = 17
7. En una urna se tiene 4 bolas negras, 5 blancas y 7 verdes. Al extraer tres de ellas, ¿Cuál
es la probabilidad que sean negras?
Solución:
La probabilidad será de
4 . 3 .2 1
=
C 43 /C16
3 = 16 . 15. 14 140
Solución:
10 9 3
x =
16 15 8
Por el método de las combinaciones:
C10
2 10 . 9 3
=
16 16 . 15
=
C2 8
99
9. Determina la probabilidad de realizar el siguiente suceso: “Obtener cara por lo menos
2 veces al lanzar al aire 3 veces una moneda”
Solución:
Como nos piden hallar la probabilidad de sacar por lo menos 2 caras, esto es 2 o más caras,
entonces las caras favorables que observamos en la tercera columna son: ccc, ccs, csc y scc,
siendo 4 posibilidades de un total de 8, luego:
4 1
=
P(por lo menos 2 caras) = 8 2
10. En una caja hay 5 bolas rojas y 3 negras. Sin mirar se saca una bola y no se devuelve a
la caja, luego se saca otra bola. ¿Cuál es la probabilidad de que las dos bolas que se
sacaron sean rojas?
Solución:
5 5
=
La probabilidad de sacar una bola roja la primera vez es de: 5+3 8 , y la probabilidad de
5−1 4
=
sacar una bola roja la segunda vez es de: 8−1 7 .
Como la ocurrencia de los sucesos están ligadas mutuamente, aplicamos el teorema dado:
5 4 20 5
x = =
P(R y R) = P(R) + P(R) = 8 7 56 14
11. Se escogen al azar 4 naranjas entre 10 naranjas que habían en una caja, de las cuales 6
estaban malogradas, ¿Cuál es la probabilidad de que 2 exactamente sean malogrados?
Solución:
4 sanos
10 x 9 x 8 x 7
C 10
4 = =
1 x 2 x 3 x 4 210 maneras
b) Si se extraen 4 naranjas, donde dos naranjas deben ser malogradas entonces los otros
dos serán sanas.
100
12. El conjunto de casos posibles de extraer dos naranjas malogradas de los 6 y 2 sanas de
los 4 será.
6x5 4 x 3
C 62 x C 42 = x
2 2 = 90 maneras
la probabilidad es de:
90 3
=
P(A) = 210 7
13. Un profesor de aula ha seleccionado a 10 niños y 4 niñas para recitar 3 poesías para
actuación central del aniversario del plante. ¿Cuál es la probabilidad de que los dos
primeros sean niños y la última sea niña?
Solución:
10 niños 14 alumnos
4 niños
Determinando las probabilidades tenemos:
10 5
=
Que el primero sea niño: 14 7
9
Que el segundo sea niño: 13
4 1
=
Que el tercero sea niña: 12 3
Como los tres eventos son independientes uno del otro, la probabilidad final será:
5 9 1 15
x x =
P(F) = 7 13 3 91
14. Nueve personas se sientan al azar en una mesa redonda. ¿Cuál es la probabilidad de
que 3 personas queden contiguas?
Solución:
Sean A, B y C las personas que van a sentarse siempre juntas o contiguas, entonces:
Calculamos el número total de formas en que se puedan sentar las 9 personas: (9-1)!= 8!
Si las 3 personas (A, B y C), siempre están juntos, entonces las formas que se pueden ubicar es:
3 x 2 x 1 = 6 formas
Finalmente, la probabilidad (P(A)) de que las tres personas queden contiguas es:
101
6 x 6! 6 x 6! 3
= =
(P(A)) = 8 ! 8 x 7 x 6 ! 28
102