[go: up one dir, main page]

0% encontró este documento útil (0 votos)
147 vistas102 páginas

Silabo de Estadística 2023 - EESTP SB Final

Cargado por

Anny As
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas102 páginas

Silabo de Estadística 2023 - EESTP SB Final

Cargado por

Anny As
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 102

POLICÍA NACIONAL DEL PERÚ

ESCUELA NACIONAL DE FORMACIÓN


PROFESIONAL POLICIAL

ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO


PROFESIONAL PNP
“SAN BARTOLO – LIMA”

SYLLABUS DESARROLLADO DE LA
ASIGNATURA “ESTADÍSTICA”

II PERIODO ACADÉMICO

2023

I. DATOS GENERALES

1
ASIGNATURA : ESTADÍSTICA
PROGRAMA DE ESTUDIO : Ciencias Administrativas y Policiales
EJE CURRICULAR : Formación Técnico Profesional Policial
AREA COGNITIVA : Formación Académica del Programa Regular
HORAS SEMESTRALES : 48 horas académicas
HORAS SEMANALES : 03 Horas
CRÉDITOS : 02
FECHA INICIO/TERMINO : 14AGO23 - DIC23
DIA Y HORA : viernes 16:50 – 19:20
PERIODO ACADÉMICO : II - Promoción 2023 - I
MODALIDAD : Presencial
CATEDRÁTICOS:

1. MAY. S PNP ARREDONDO ARREDONDO, Joel (Coordinador)


2. CAP. S PNP RAMOS ELGUERA, Jessica Yessenia
3. CAP. S PNP LLERENA QUISPE, Giancarlo Dante
4. TNTE PNP GÜIVIN LOPEZ, Mary Betsi
5. SB PNP VILCHEZ GUTIERREZ, Alfredo Antonio
6. SB PNP FLORES VALERIANO, Lesly
7. ST3 PNP SOZA ROMERO, Pablo
8. S1 PNP PACOTAYPE HUAMAN, Rogelio Joseph
9. S2 PNP TAMAYO ROLDAN, Nestor Emilio
10. S2 PNP GUTIERREZ PALOMINO, Diana Rocio
11. S2 PNP QUISPE SALAZAR, Paul Neder
12. VILLEGAS GARCIA, Maribel

II. SUMILLA

2
La presente asignatura aporta al perfil del Técnico Profesional PNP en el curso de
Estadística los métodos y procedimientos para realizar la recopilación,
organización, presentación, análisis e interpretación de datos para la buena toma
de decisiones ante hechos específicos.
Asimismo, presenta las técnicas para el tratamiento de la información y el cálculo
de las medidas de posición, tendencia central, dispersión, casos de probabilidades
y análisis combinatorio aplicados a la función policial.

III. OBJETIVO GENERAL:

Proporcionar los métodos, técnicas y procedimientos para el análisis de datos,


aplicados a la función Policial para la buena toma de decisiones.

IV. OBJETIVOS ESPECÍFICOS:

Al finalizar el curso las estudiantes de la Promoción 2023-I, serán capaces de:


 Recopilar, organizar, analizar y presentar datos reconociendo la característica
de la variable.
 Calcular las medidas de posición, tendencia central y de dispersión para
aplicarlas a la función Policial.
 Analizar e interpretar resultados estadísticos de problemas contextualizados a
la función Policial.
 Determinar todas las posibilidades de un evento y predecir las frecuencias en
que ocurren.

V. METODOLOGIA:
El desarrollo del curso se basa en la participación activa de las estudiantes
mediante el desarrollo de problemas aplicados a la actividad policial.

El método de enseñanza será el socrático, teniendo en cuenta la lluvia de ideas y


aplicaciones con casuística policial.

Las clases teóricas se complementarán con las prácticas y talleres dirigidos.


Se llevará a cabo el proceso enseñanza aprendizaje en la modalidad presencial.

VI. CONTENIDOS.
COMPETENCIA
I UNIDAD Comprender los conceptos básicos de la
CONCEPTO BÁSICO DE LA ESTADÍSTICA Estadística descriptiva como inferencial,
DEFINICIÓN DE VARIABLES población, muestra, definición de
variables, tanto cualitativas como
cuantitativas para proyectar soluciones.

3
SESIÓN 01  Reconocer, describir, analizar,
expresar, clasificar y formalizar los
 Presentación de la Asignatura.
conceptos de la estadística tanto
 Conceptos básicos
descriptiva como inferencial.
 Estadística Descriptiva
PRIMERA  Identificar el contenido del curso
 Estadística Inferencial
Diferencia los conceptos y teorías
SEMANA  Población y muestra
Estadísticas.
 Parámetro estadístico
(03 hrs)  Reconocer que es una población y
una muestra.
18AGO23
 Identificar los parámetros
estadísticos

SESIÓN 02  Clasificar los distintos tipos de


variables, así como clasifica las
 Variables. Definición
SEGUNDA nomenclaturas Estadísticas.
 Clasificación de variables
 Mostrar interés en conocer los tipos
SEMANA  Variables Cualitativa. Nominal y
y clases de variables.
ordinal.
(03 hrs)  Discriminar los distintos tipos de
 Variables Cuantitativa discreta y
25SEP23 variables, así como clasifica las
continua.
nomenclaturas estadísticas
 Valor Estadístico.
 Escalas de medición
 Recolección, organización y
técnicas para recolectar datos

II UNIDAD COMPETENCIA
DISTRIBUCIÓN DE FRECUENCIAS, Preparar el cuadro de distribución de
REPRESENTACIONES GRÁFICAS. frecuencias para su interpretación.

SESIÓN 03  Utilizar la agrupación de frecuencias


absolutas y relativas simples.
 Tabulación de datos
 Preparar el cuadro de distribución
 Cuadro de distribución de
de frecuencias
frecuencias, elementos.
 Ordenar, calificar los datos y su
 Frecuencias. Frecuencia
TERCERA periodicidad.
absoluta, frecuencia absoluta
SEMANA acumulada, frecuencia relativa,
(03 hrs) frecuencia relativa acumulada,
frecuencias porcentuales.
01SEP23  Distribución para variable
cuantitativa discreta y continua
 Cuadro de frecuencias para una
variable cualitativa.

4
SESIÓN 04
 Conocer y utilizar sus datos para su
 Cuadro de frecuencias para una
análisis.
variable cuantitativa agrupados
 Inferir datos sobre medidas
y no agrupados.
CUARTA tendencia central para datos
 Distribución de frecuencias por
agrupados y no agrupados
SEMANA intervalo
 Interpretar gráficos
 Gráficos
(03 hrs)  Entrega de temas de Trabajo
08SEP23 Aplicativo Individual (TAI) y
Colaborativo (TC)

COMPETENCIA
III UNIDAD  Organizar los estadígrafos de
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN tendencia central y gráficos en la
presentación de diversos datos
frente a la realidad del campo
policial, manifestando confianza y
perseverancia en su aprendizaje.

SESIÓN 05  Conocer, aplicar y resolver con


claridad ejercicios de tendencia
QUINTA
central.
 Medidas de tendencia central:
SEMANA  Identificar las propiedades de media
media, mediana y moda
(03 hrs) aritmética, mediana y moda.
 Datos originales de aplicación al
 Interpretar el valor central y el de
15SEP23 contexto.
mayor repetición.

 Conocer y comprender la
agrupación de frecuencias absolutas
SESIÓN 06
SEXTA y relativas simples y acumuladas
 Prácticas dirigidas sobre  Preparar cuadro de distribución de
SEMANA Población, muestra, evaluación frecuencias.
(03 hrs) de Distribución de frecuencias  Ordenar, clasificar los datos y su
con variable cuantitativa y periodicidad.
22SEP23
cualitativa, y gráficas de  Realiza la gráfica de frecuencias para
frecuencias, y medidas de su interpretación
tendencia central.  Utiliza la media, mediana y moda e
 Repaso de las unidades interpreta sus valores.
didácticas anteriores.

SÉPTIMA
SEMANA SESIÓN 07
(03 hrs) PRIMERA EVALUACIÓN PARCIAL
29SEP23

5
SESIÓN 08  Identificar las diferentes medidas de
OCTAVA
posición
 Medidas de posición no central
SEMANA  Proporcionar información de la
 Cuartiles
(03 hrs) variable de estudio en base a los
 Deciles
estadígrafos de posición
06OCT23  Percentiles
 Relacionar los datos agrupados con
 Datos no agrupados y
los porcentajes relacionados
agrupados

SESIÓN 09  Identificar y contrasta las fórmulas


NOVENA
con los resultados.
 Medidas de dispersión
SEMANA  Analizar e interpreta la separación
 Definición
(03 hrs) de datos.
 Tipo
 Establecer la variabilidad de la
13OCT23  Rango
variable aleatoria.
 Rango intercuartil
 Resolver con precisión en sus
 Desviación media
cálculos.
 Varianza. Formas de calcular
 Resolver casos, relaciona y decide la
variación de datos.

SESIÓN 10  Conocer la forma de calcular la


desviación
DECIMA  Desviación estándar.
 Analizar que tan dispersos están los
 Definición.
SEMANA datos respecto a la media.
 Varianza poblacional y muestral
(03 hrs)  Demostrar la variabilidad de un
 Cálculo de la desviación
conjunto de datos respecto de la
20OCT23 estándar
media aritmética.
 Interpretación
 Comparar las dispersiones de dos
 Coeficiente de variación
distribuciones distintas.
SESIÓN 11
 Aplicar y resolver con claridad
DÉCIMA  Prácticas dirigidas sobre
ejercicios de aplicación
PRIMERA medidas de posición: Cuartiles,
 Resolver problemas estadísticos
SEMANA deciles, percentiles de datos no
aplicados con precisión.
agrupados y agrupados
(03 hrs)
 Medidas de dispersión: Rango
27OCT23 intercuartil, varianza, desviación
estándar, coeficiente de
variación
 Repaso de las unidades
didácticas correspondientes.
DÉCIMA
SEGUNDA SESIÓN 12
SEMANA SEGUNDA EVALUACIÓN PARCIAL

6
(03hrs)
03NOV23

COMPETENCIA
IV UNIDAD  Conocer las posibilidades que ocurra
PROBABILIDAD Y ANÁLISIS COMBINATORIO un posible resultado en sucesos de
un evento.
 Predecir el número de situaciones
que se pueden dar en un conjunto
finito de acciones
DÉCIMA
SESIÓN 13  Afianzar el aprendizaje
TERCERA
 Repaso
SUSTENTACION DE TRABAJOS
SEMANA
COLABORATIVOS
(03 hrs)
10NOV23
SESIÓN 14  Calcular la probabilidad de los
posibles resultados de los sucesos.
DÉCIMA  Probabilidades. Concepto
 Conocer el espacio muestral de los
 Teorema de probabilidad
CUARTA eventos.
 Espacio muestral
SEMANA  Realizar el cálculo del número de
 Experimentos y eventos o
posibilidades de múltiples eventos
(03 hrs) sucesos
que ocurren.
 Principios fundamentales del
17NOV23 conteo
DÉCIMA SESIÓN 15  Realizar el análisis combinatorio
para diferentes eventos.
QUINTA  Análisis combinatorio
 Realizar agrupaciones con los
 Eventos
SEMANA elementos de un conjunto,
 Variables aleatorias discretas y
(03 hrs) formándolas y calculando su
continuas.
número.
24NOV23  Resolver problemas estadísticos con
fórmulas para las Permutaciones,
Combinaciones y ordenaciones de
datos.
DÉCIMA
SESIÓN 16
SEXTA
EVALUACION FINAL
SEMANA
(04 hrs)
01DIC23
VII. EVALUACIÓN
La asistencia a las sesiones es obligatoria en un 100%, salvo situación de servicio,
lo que se informará al Departamento Académico (DACA).
El proceso de evaluación del aprendizaje será permanente, comprenderá:

7
A. Evaluación Diagnóstica o de Entrada para valorar el nivel de conocimiento de la
asignatura.
B. El trabajo aplicativo individual (TAI) se calificará solo la presentación.
C. El trabajo colaborativo (TC) se calificará tanto la presentación como la
sustentación.
D. Evaluación Formativa o de Proceso para comprobar el rendimiento académico,
pronosticar posibilidades de desarrollo de las estudiantes (a) y reorientar la
metodología, se aplicarán:
1. El TAI y TC.
2. Dos exámenes escritos parciales (7º y 12º semana), enmarcados en los
modelos de las Pruebas que son propias de la naturaleza de la Asignatura.
3. Un examen final (16º semana),

E. Evaluación Sumativa para comprobar el nivel de desarrollo cognitivo, reflexivo y


del pensamiento lógico, para lo cual se aplicará un examen final (16º semana),
de similar característica empleada en los exámenes parciales.
F. El Promedio General se calculará en concordancia con las disposiciones
establecidas en el Manual del estudiante de la Escuela de Formación de la PNP
y con la naturaleza de la asignatura, conforme se detalla a continuación:

Promedio General (PG):


PEP ( 3 ) +TAI ( 1 ) +TC ( 2 ) + EF (4)
PG=
10
Donde:
PEP : Promedio de Exámenes Parciales
TAI : Trabajo aplicativo individual
TC : Trabajo colaborativo
EF : Examen Final

V. BIBLIOGRAFIA

 Barreto C. (2008). Estadística básica, aplicaciones. Ed. Gráfica Real S.A.C. Perú.
 Gómez M. (1977). Estadística descriptiva.
 Jhonson K. Estadística elemental
 Lipschutz, Seymour & Schiller J. (2000). Introducción a la probabilidad y
estadística. Ed. McGraw Hill.
 Martínez C. Estadística aplicada
 Quintana C. (1992). Estadística elemental. Ed. Master libro S.A.
 Spiegel M. Estadística
 Universidad Juárez autónoma de Tabasco. Análisis de datos con herramientas
estadísticas. Recuperado de https://sites.google.com/site/estadisticadm/b-
organizacion-y-presentacon-de-datos/b-3-medidas-de-tendencia-central

8
UNIDAD I

SESIÓN 1
ESTADÍSTICA DESCRIPTIVA - INTRODUCCIÓN

INTRODUCCION

La Estadística es esencial en la policía, en la investigación, la administración, la


producción, la educación y todas las ramas del saber humano. El énfasis destaca en la
recolección, presentación y análisis de datos.
A diario se está procesando información estadística para tomar decisiones, desde los
consumidores que utilizan los precios unitarios, hasta las grandes compañías
nacionales e internacionales o países que están desarrollando actividades inherentes a
su desempeño
Este primer capítulo tiene por objetivo presentar algunos conceptos básicos de
estadística, así como de sumatorias simples y dobles los cuales se van a utilizar con
frecuencia para una mejor comprensión de los capítulos siguientes.

1.1 ESTADISTICA

Es una ciencia que nos provee de un conjunto de métodos, pautas y procedimientos,


para la recolección, organización (clasificación), análisis e interpretación de datos en
forma adecuada, para en base de ellos, tomar decisiones cuando existen situaciones
de incertidumbre.

Otras definiciones son:


La Estadística es una ciencia que trata de la recolección, organización, presentación y
análisis de datos con el fin de realizar una toma de decisiones más adecuada
Es una matemática aplicada para el análisis de datos.
Es el estudio de los fenómenos aleatorios.

Ejemplos:

 Estudiar la variación mensual del precio del dólar durante los últimos 5 años, para
averiguar qué mes del año es el más favorable para comprar dólares.
 Estudiar la variación mensual de efectivos policiales contagiados y fallecidos por el
Covid-19 durante el año 2020.
 Hallar el promedio y la varianza de la comisión de los diferentes delitos y faltas
cometidos en el distrito de San Bartolo.

1.2 CLASIFICACIÓN DE LA ESTADISTICA

La estadística se divide en dos grandes ramas de estudio que son:


a) La estadística descriptiva, la cual se encarga de la recolección, clasificación y
descripción de datos muestrales o poblacionales, para su interpretación y
análisis y

9
b) La estadística inferencial, que desarrolla modelos teóricos que se ajustan a una
determinada realidad con cierto grado de confianza con la finalidad de inferir
resultados.
Estas dos ramas no son independientes; por el contrario, son complementarias y
entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el
fin de que quien tenga poder de decisión, tome las medidas necesarias para
transformar ese futuro o para mantener las condiciones existentes. La estadística
se divide en dos ramas:

 ESTADISTICA DESCRIPTIVA
Es la parte de la estadística que consiste en la recolección, organización,
presentación y análisis de datos para su descripción e interpretación según lo
requerido.

 ESTADISTICA INFERENCIAL
Es la parte de la estadística que consiste en tomar decisiones sobre el
comportamiento de una variable de interés de una población estadística en
estudio; utilizando para tal objetivo una muestra al azar. Es decir, a partir de los
resultados obtenidos al procesar los datos de una muestra se generaliza el
resultado de dicha variable en la población, con un cierto riesgo que es
cuantificado por la teoría de la probabilidad. La estadística inferencial
proporciona métodos para el análisis de datos.

1.3 CONCEPTOS BASICOS

1.3.1 Población

Es la totalidad de unidades elementales (personas o cosas) sujeto a estudio y


que poseen una característica común, al tamaño de la población (número de
unidades elementales) se simboliza con la letra mayúscula “N”. Una población
en estudio puede ser finita (Se puede enumerar sus Elementos) o infinita (no
se pueden enumerar sus elementos).
Ejemplos:

 Todas las tiendas que se dedican a la venta de gas en el distrito de la


Molina en el año 2019 (N= 850).
 Todos los establos de ganado vacuno en el departamento de Cajamarca en
el I semestre del 2019 (N= 2350).
 Todos los estudiantes matriculados en el semestre 2019 - I
 Todos los Cadetes de la Escuela de Oficiales de la PNP, en el proceso de
formación en el año 2015. (N= 788).
 Todas las multas impuestas por la PNP por infringir al Reglamento Nacional
de Transito durante el mes de setiembre del año 2019 (N= 1 679).
 Todos los usuarios que concurren a la Biblioteca de letras y Ciencias
Humanas de la UNMSM, un día cualquiera (N= 1742).

10
1.3.2 Muestra

Es una parte representativa de la población estadística en estudio o también se


dice que es un subconjunto de unidades elementales de la población. Al tamaño
de la muestra se le representa con la letra minúscula “n”. Se dice que una
muestra es aleatoria o al azar, cuando todos los Elementos de la población
tienen la misma probabilidad de ser parte de la muestra.

Ejemplo 1:
Para estudiar cuál es el candidato presidencial por el cual votarán los peruanos
en las próximas elecciones, se toma una muestra de 3500 personas de todo el
país. La pregunta es la siguiente, ¿por quién votará en las próximas elecciones
presidenciales? Determine la población, muestra e individuos.

En este caso, la población sería la población electoral del país, es decir, peruanos
con derecho a voto.
La muestra sería el conjunto de 3500 peruanos que forman parte de la
población.
Un individuo sería cada uno de los peruanos con derecho a voto.

Ejemplo 2:
Un alumno de la escuela de Suboficiales de la Policía Nacional de San Bartolo
quiere conocer si los profesores de la escuela, prefieren dictar clases con ropa
formal o con ropa informal. Para ello, realiza una encuesta a 60 profesores de la
escuela de Suboficiales elegidos de forma aleatoria. Identifique la población,
muestra e individuos.

Población: conjunto de todos los profesores de la escuela de Suboficiales de la


Policía Nacional.
Muestra: 60 profesores de la escuela de Suboficiales de la Policía Nacional.
Individuo: cada uno de los profesores de la escuela de Suboficiales de la Policía
Nacional.

Ejemplo 3:
Un profesor desea realizar un análisis estadístico de las notas del examen final de
matemáticas de sus alumnos de último año. Por ello, coloca todas las notas
obtenidas en Excel y usa las funciones y herramientas estadísticas. La
información obtenida, ¿pertenece a la muestra o a la población?

En este caso, la población, son todas las estudiantes de último año. Se estudiarán
sus notas, pero todas las notas obtenidas. No se ha realizado ningún muestreo,
por ello, la información obtenida, pertenece a la población.

Muestreo. Es el procedimiento para obtener una muestra representativa


de la población en estudio.

11
1.3.3 Unidad Elemental

Es cada uno de los elementos que conforman la población en estudios, de la cual se


requiere información. De una unidad elemental se define muchas variables de interés
para el investigador. Ejemplo:

Una población que se dedica a la venta de gas en el distrito de la molina.

Dato u observación.
Es el valor (atributo, conteo o medición) que forma la variable de interés en la unidad
elemental. Los valores que se toma una variable en particular x, se representa con
letras minúsculas acompañadas por subíndice, es decir:

X = ( X 1 , X2 , X 3 ………………… X n )
X i = valor que toma la variable x en la i-esima observación

12
SESIÓN 2
VARIABLES CUALITATIVAS Y CUANTITATIVAS

VARIABLE

Es una característica de interés que se desea analizar de una unidad Elemental. La


variable en estudios la fija el investigador, el valor que toma la variable (dato u
Observación) cambia de unidad elemental a otra. A una variable se le simboliza
universalmente con las ultimas letras del Abecedario, tales como x, y, z, o también
letras mayúsculas acompañada con subíndice, tales como:

X1, X2, ……..X k

Ejemplo de variables en estudio:

 x = Montos (S/) por venta diaria de balones de gas


 y = Cantidad de ganado vacuno en un establo
 z = Color de ojos de los Cadetes de la EO- PNP
 w = Volumen (cm 3) del contenido de botella de gaseosa
 t = Tiempo (minutos) que permanece un usuario en un cajero automático

2.1 TIPOS DE VARIABLES:

De acuerdo a los valores que toma la variable en estudio, se clasifican en:

 VARIABLE CUALITATIVA

Cuando los valores que toma la variable en estudio provienen de una cualidad o
atributo, se divide a su vez en nominal y jerárquica (ordinal).

 Variable Cualitativa Nominal


Una variable se considera cualitativa nominal cuando con los valores que
Forma esta variable no es posible establecer un orden de acuerdo a su
importancia.

Ejemplos:
 x = color de los ojos de las estudiantes PNP
 y= Preferencias a determinadas marcas de jabones de tocados por las
estudiantes femeninas.
 z = Sexo de las estudiantes PNP

 Variable Cualitativa Ordinal o Jerárquica


Una variable ordinal es un tipo de variable estadística de tipo cualitativo que
expresa con palabras una cualidad de naturaleza ordenable.
Es decir, una variable ordinal es una variable que puede ser ordenada. Así, si
decimos que en una carrera de 100 metros lisos Andrés quedó primero, José
segundo y Pablo tercero. Esa posición es ordenable, se puede ordenar de

13
mayor a menor o de menor a mayor. Es decir, de forma descendente o
ascendente.

De manera que, en referencia a las variables cualitativas nos encontramos


con las ordinales. Las variables ordinales, a diferencia de las nominales, sí
pueden ser ordenadas de forma jerárquica. Ejemplos:

o Calificación crediticia. Este será mejor cuanto mayor sea la solvencia


según la agencia de calificación.
o Nota de una prueba. Por ejemplo, un examen que se califica como
suspenso, aprobado, notable, sobresaliente y matrícula de honor.
o Posición en una carrera deportiva. Primero, segundo, tercero, cuarto,
etc.
o Satisfacción con un servicio al cliente. Muy insatisfecho, insatisfecho,
neutro, satisfecho y muy satisfecho.
o Grados oficiales PNP: Teniente General, General, Coronel, Comandante,
Mayor, Capitán, Teniente, Alférez.
o Grados Académicos: Bachiller, magister, Doctor
o Clase social: Alta, media, baja.

 VARIABLE CUANTITATIVA
Los valores que toma la variable provienen de un conteo o de una medición
instrumento de medida, metro, balanza, cronometro, termómetro, etc). Se
divide a su vez:

 Variable Cuantitativa Discreta


Una variable se considera cuantitativa discreta cuando los valores que toma
la variable provienen de un conteo. También se dice que los valores que
toma esta variable están asociados a los números enteros.
Ejemplos:

o X = Numero de gusanos por hoja


o Y = Número de hijos por familia
o Z = Número de accidentes diarios de transito registrados durante un
o mes determinado.
o T= Numero de artículos de las revistas científicas.

 Variable Cuantitativa Continua


Una variable se considera cuantitativa continua cuando los valores que toma
la variable provienen de una medición, es decir, los valores que toma se
encuentran en un intervalo. También se dice que los valores que toma esta
variable están asociados a los números reales.
Ejemplos:

o X= Tiempo de vida (hora) de baterías para automóviles


o Y= Edad (años) de los estudiantes matriculados en el presente año
Académico.

14
o Z = Estatura (mts) de las estudiantes PNP.

2.2 PARÁMETRO
Es un valor fijo que caracteriza a la variable de interés en la población en
estudio. Para conocer este valor se requiere tener Todos los datos de la variable
en la población por lo general este valor casi nunca se conoce el objetivo de
investigador es estimarlo a través de una muestra aleatoria. Los parámetros más
usados son:
 La media aritmética
 La mediana
 La Moda
 La media Geométrica
 La media Armónica
 La varianza
 La Desviación Estándar
 Coeficiente de variación

Valor Estadístico o estimado

Es un valor calculado con los datos de la muestra aleatoria y se Supone estima al


valor del parámetro de la variable en estudio en la Población. Este valor cambia de
una muestra a otra muestra. La fórmula permite calcular el valor estadístico,
recibe el nombre de Estimador o estadística. Los valores estadísticos más
utilizados son:

 La media aritmética
 La mediana
 La Moda
 La media Geométrica
 La media Armónica
 La varianza
 La Desviación Estándar
 Coeficiente de variación

Ejercicios resueltos

Ejemplo 1
En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que se
dedican a la venta de combustible de un día determinado, se obtiene en
siguiente resultado, el monto de venta diaria promedio de S/. 12 600.50 con esta
información identificar población estadística, unidad elemental, variable en
estudio, tipo de variable, un posible dato, tamaño de la muestra, parámetro y
estimado o valor estadístico.

Solución:
Población estadística : Todos los grifos de Lima Metropolitana, que se
dedican a la venta de combustible.

15
Unidad elemental : Un grifo de Lima Metropolitana, que se dedican
a la venta de combustible.
Variable en estudio : Monto por venta ( s / ) diaria de combustible
Tipo de variable : Variable cuantitativa continua
Dato u observación : S/ 12 600.50
Tamaño de la muestra : 30 grifos
Parámetro : No se conoce el monto promedio por venta
diaria en la población.
Dato estadístico : S/ 12 600.50.

Ejemplo 2

De una población de 2 042 revistas científicas de biología, el 41,63% están


escritas en idioma inglés, Una muestra aleatoria de 50 revistas arroja que el
42.12% están escritas en inglés, el promedio de artículos por revistas es de 12,4.
Con esta información identificar, población unidad elemental, variables, en
estudios, tipos de variables, posibles datos, tamaño de la muestra, parámetro y
estimado o valor estadístico.

Solución:
Población estadística: Todas las revistas científicas de biología N=2 042
Unidad elemental : Una revista científica de biología
Tamaño de la muestra:50 revista científicas de biología

Variable en Tipos de Datos u Parámetro Estimador o


estudio variables observaciones valor
estadístico
Idioma de la Cualitativa Español Ingles 41,63% 42,12%
revista Nominal Portugués
Número de Cuantitativa 12,16, 8, 9 etc Se desconoce 12, 4
artículos Discreta artículos

Ejercicios Propuestos

En cada uno de los siguientes enunciados identificar de ser posible, la población,


unidad elemental, variables en estudio, tipos de variables, tamaño de la muestra,
valores estadísticos, parámetros, y un ejemplo de dato en cada caso:

1. De una población de 1000 alumnos PNP, se elige una Muestra aleatoria de 25


cadetes, arrojando la siguiente información: el 98.4% son varones, la estatura
promedio es de 1,69 mts, el gasto semanal promedio por cafetería es de S/
35.8 el 30% se encuentran en el 5to año de estudio.
2. Una muestra aleatoria de 30 recién nacidos en la Maternidad de Lima Arroja
un peso promedio de 3.50 Kg.

16
3. Una muestra aleatoria de 550 peruanos mayores de 18 años arroja que el 30%
está de acuerdo con las medidas económicas anunciados por el gobierno hace
uno días.
4. Para analizar la posibilidad de lanzar al mercado una nueva marca de
cigarrillos, se efectuó una encuesta entre fumadores que transitan por la
quinta cuadra de la av. Canadá entre las 5 P.m. y 8 P.m. del día 14 de febrero,
para ello se seleccionó en forma aleatoria a 80 fumadores obteniéndose los
siguientes resultados: el 65% prefiere los cigarrillos importados que los
nacionales y el precio promedio que pagan al comprador una cajetilla es de S/
7.40.

2.3 SUMATORIAS SIMPLES DOBLES Y NOTACION PUNTUAL

SUMATORIAS SIMPLES
Sea x, una variable en estudio que toma valores x 1 x1 …….xn , la Suma de los valores
x 1 + x 2 +……….+xn , se representa mediante el operador matemático ∑ x i ; que
significa sumar todos los valores x i
i=1
para “i” que toma valores enteros positivos consecutivos desde 1 hasta n, es decir:

n
X 1 + x 2+ ……. x n
∑ xi ;
i=1
Ejemplos:
1. Desarrollar las siguientes sumatorias
11
∑ x 2i + 1 = x 3 + x 5 + …… x11
i=1

6 2 2 2 2
∑ x2 = x 2 + x 4 + ……+ x12
i=1

4
∑ 2x i +1 = 2x 2 + 2x3+ ……… 2x 5
i=1 y 2i+1 y3 y5 y9

2. Supongamos que una variable X toma los siguientes valores


X 1 = 7 x 2= 9 x3 = 5 x 4 = 6

Calcular:

4
∑ 2x 2 i + 3 = 2( 7 )2 +3 + 2 (9) 2 + 3 ( 5) 2 +3 + 2 ( 6)2 +3
i=1 xi–2 7-2 9-2 5-2 6-2

4
∑ 2x 2 i + 3 = 20.2 + 23.57 +17.67 + 18.75 = 80.19

17
i=1 xi–2

2.4 ORGANIZACIÓN DE DATOS

Tiene por objetivo presentar los datos obtenidos de una población o muestra para
una o más variables en estudio, en tablas de distribución de frecuencias y sus
correspondientes gráficos, con la finalidad de resumir la información para que sea
de fácil interpretación y análisis.

RECOLECCIÓN Y ORGANIZACIÓN DE DATOS

La recolección de datos se refiere al enfoque sistemático de reunir y medir


información de diversas fuentes a fin de obtener un panorama completo y preciso
de una zona de interés. Permite a un individuo o empresa responder a preguntas
relevantes, evaluar los resultados y anticipar mejor las probabilidades y tendencias
futuras.
La exactitud en la reunión de datos es esencial para garantizar la integridad de un
estudio, las decisiones comerciales acertadas y la garantía de calidad.
La obtención de datos para el análisis estadístico es un proceso integral que
incluye las siguientes etapas típicas:

1. Definición de los objetivos del estudio observacional o experimento. Por


ejemplo, el cálculo del ingreso promedio familiar en los estudiantes de la
preparatoria, o la comparación de la efectividad de un medicamento que se ha
utilizado normalmente frente a otro producto nuevo.

2. Definición de la variable y la población de interés. Este aspecto tiene que ver


con los alcances del estudio. Por ejemplo, el sueldo del jefe de familia del
estudiante, o el tiempo de recuperación de los pacientes de una cierta
enfermedad y de un centro hospitalario específico a los cuales se aplican los
medicamentos.

3. Definición de los métodos para la obtención y medición de los datos. Por


ejemplo, un cuestionario, una indagación en los centros de trabajo, o vía
telefónica, o el seguimiento de una bitácora médica. También incluye, en su
caso, la decisión de la obtención de un censo o la determinación del tamaño de
la muestra.

4. Determinación de las técnicas descriptivas o de inferencia que sean las


apropiadas para el análisis de los datos.

18
La recolección de datos no surge de la nada, estos deben ser recopilados. Para ello
debe tenerse en cuenta la importancia de contar con buenas técnicas de
recolección y precisión para que el margen de error sea mínimo.
Los datos pueden tener cualquier origen, puede ser un conjunto de personas,
animales, plantas, objetos o incluso números correspondientes a mediciones,
dependiendo de dónde se centre el interés del estudio. Independientemente de la
naturaleza de los elementos (entidades) del conjunto de estudio, a la totalidad
suele llamársela población.

TÉCNICAS PARA LA RECOLECCIÓN DE DATOS


Existen diferentes métodos y técnicas de recolección de datos que te pueden ser
de utilidad. La elección del método depende de la estrategia, el tipo de variable, la
precisión deseada, el punto de recolección y las habilidades del encuestador.

1. La entrevista para investigación


Las entrevistas es uno de los métodos más comunes. Si te decides a hacerla,
pon especial atención en las preguntas que realizarás, que también dependen
de si harás una entrevista cara a cara, vía telefónica e incluso si es por correo
electrónico. Conoce los tipos de entrevista y selecciona la adecuada para tu
investigación. Toma en cuenta que por lo regular se necesitan más recursos,
tanto económicos, como de personal para la realización de entrevistas. Sobre
todo, si decides realizar entrevistas en campo, o vía telefónica.
Echa mano de toda la información que tengas al alcance. Quizá existan archivos
de entrevistas de años anteriores que te puedan servir de referencia para tu
investigación. Conocer el comportamiento pasado de tus consumidores es de
gran importancia al momento de analizar cómo han cambiado los hábitos de
consumo.

2. Entrevistas telefónicas
Las entrevistas telefónicas permiten que los investigadores recolectan más
información en una menor cantidad de tiempo y ahorrando en gastos como el
traslado y el material de las encuestas. Una ventaja de esta herramienta es que
los participantes se sienten más confiados al momento de contestar porque no
están siendo observados.

19
Entre las ventajas de esta herramienta se encuentra el gran alcance que tiene y
la fácil administración de los datos obtenidos. Sin embargo, en muchas
ocasiones, el investigador no tiene el control de la entrevista, además, debe
procurar que sea un proceso corto para que no provoque que el participante no
lo abandone.

3. El cuestionario
Los cuestionarios son una herramienta útil para la recolección de datos. Para
obtener los resultados esperados, es necesario que se realicen
cuidadosamente. Es por eso que antes de redactarlo, es importante que el
investigador defina los objetivos de su investigación.

Existen dos formatos de cuestionarios:


- Los cuestionarios abiertos, los cuales se aplican cuando se quiere conocer la
opinión de las personas, sus experiencias y sentimientos sobre un tema
específico.
- El cuestionario cerrado los investigadores tienen el control de lo que
preguntan y desean saber, lo que puede provocar que la respuesta de los
participantes esté forzadas y limitadas.

4. Método de observación
Si lo que prefieres es hacer observación in situ para conocer el comportamiento
de tus clientes, puedes realizarla haciendo uso otras metodologías.
Por ejemplo, en un dispositivo móvil, donde tengas acceso al cuestionario que
hayas creado con los puntos a investigar, e irlo llenando al instante con la
información obtenida durante tu observación.
Debemos tener en cuenta que la manera en que registres la información será
de gran ayuda al momento de analizarla. Poder medir y presentar informes con
datos precisos y reales es muy importante para la correcta toma de decisiones.

5. Encuestas online
Hacer recolección de datos a través de encuestas online tiene grandes ventajas.
Tienes al alcance diversos tipos de preguntas, el uso de variables personalizadas
y lógicas que te permiten obtener mejores resultados y te ayudan a conocer a
profundidad a tus clientes. Los puedes ver en tiempo real para darle
seguimiento a tu investigación; además de generar reportes en diversos
formatos.
Considera también que el hacer recolección de datos a través de encuestas
online, tiene un costo menor que, por ejemplo, hacerlo a través de entrevistas
presenciales, sin olvidar que puedes tener tus resultados en menor tiempo, en
lugar de días, semanas, e incluso meses que es el tiempo que se podría llevar
una recolección de datos a través de entrevistas o el método de observación.

6. Focus group
Un focus group es una forma de estudio cualitativo que consiste en realizar una
reunión donde las personas puedan dialogar o resolver un tema establecido.
Este tipo de debate ayuda a generar ideas, opiniones y actitudes que no se
pueden observar con otro método de recolección de datos.

20
Con este método se puede obtener grandes cantidades de información, ya que
los participantes se sienten confianza para dar su opinión y ofrecer respuestas
honestas y exactas.
Las sesiones de grupo son la herramienta ideal para obtener retroalimentación
de los participantes. Sin embargo, tienen algunas desventajas. Entre las más
importantes se encuentra la falta de control que se tiene durante el debate, lo
que provoca que el tiempo se vaya con temas irrelevantes y complique el
análisis de la información. Esto se puede solucionar con un moderador experto
en el área.

7. Paneles online para la recolección de datos


Los paneles online son una herramienta que permite recolectar datos a través
de personas altamente profesionales y calificadas. Una de las ventajas de este
método es que los participantes darán respuestas específicas y claras.
Algunas de las ventajas de utilizar paneles online son su facilidad para acceder a
los canales y obtener información directa del público objetivo. Además, es un
método de investigación muy económico que permite obtener información de
calidad. Te recomiendo leer sobre las ventajas de utilizar paneles online.

PROBLEMA PROPUESTOS

Completar las siguientes encuesta y formulario

01. ¿A qué edad tuviste mayor participación en tu escuela?


7; 7; 7; 8; 8; 8; 8; 8; 8; 8; 9; 9; 9; 9; 10; 10; 10; 11; 12; 12; 12; 12; 12; 12; 13; 14; 14; 15;
17; 20

Edad 7 8 9 10 11 12 13 14 14 15 17 20

fi

02. La escuela cuenta con espacios que permiten la participación en las diversas
actividades que se desarrollan
 Masculino: S; S; N; N; S; S; N; N; N; S; S; N; N; N; S; N; N
 Femenino: N; N; N; N; N; N; N; N; N; N; N; N; S.

Sexo si no Si(%) No(%) Total %


Masculino 100%

Femenino 100%

Total 100%

03. ¿Qué medidas de bioseguridad estás tomando en cuenta para cuidar tu salud en los
espacios públicos que garantice una participación segura?

21
 Lavado de manos: S; S; N; N; N; S; S; N; N; N; N; N; N; N; S; S; S; N; N; N; N; N; N;
S;N; N; N; N; N; N
 Distanciamiento social: N; N; N; N; N; N; S; S; N; N; N; S; N; N; S; N; N; N; N; N; N;
N; N; N; N; S; S; N; N; N
 Uso de mascarilla: S; S; N; N; N; N; N; S; S; N; N; N; S; N; N; N; S; N; N; N; S; S; N;
N; N; N; S; S; N; N

Medidas si no Si(%) No(%) Total %


Lavado de manos 100%

Distanciamiento social 100%

Uso de mascarilla 100%

UNIDAD II

SESIÓN 3
FRECUENCIAS ABSOLUTAS Y RELATIVAS

CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

Una tabla de distribución de frecuencias es un arreglo rectangular en filas y columnas


en la cual los datos de una muestra o población son resumidos.
En la primera fila de la tabla se colocan, el nombre de las variables en estudio , la
frecuencia absoluta, frecuencia relativa , la frecuencia absoluta acumulada , frecuencia
relativa acumulada y la marca de clase solo para variables cuantitativa continuas.

TITULO

Variable Frecuencia Frecuencia Frecuencia Frecuencia Marca de


en absoluta relativa absoluta relativa clase
estudio acumulada acumulada
Clas -1
Clas-2

Clas-k
Total

Leyenda:
Fuente :

3.1 ELEMENTOS DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS.

 TITULO

22
Se coloca en la parte superior central de la tabla, el titulo debe ser, claro
preciso, y conciso y guarde relación con la variable que se estudia.
 FUENTE
Se coloca en la parte inferior de la tabla y corresponde al nombre de la entidad o
literatura de donde se obtuvo la información, debe incluir la fecha si es posible, si
el mismo investigador es autor de dicha información, debe colocar fuente propia
 LEYENDA
Se coloca delante de la fuente y corresponde a una nota o aclaración con
respecto al contenido de la tabla.
 CLASE
Se considera clase a una cualidad, un numero o intervalo, las clases para una
tabla de distribución de frecuencia, deben ser mutuamente excluyentes, es decir,
un dato solo puede pertenecer a una determinada clase. Al Numero de clases de
una tabla se le representa por la letra “K”

Si existe una gran cantidad de datos discretos o continuos, el número de clase


debe encontrarse entre 5 y 15. Un número pequeño de clases puede ocultar la
distribución real del conjunto de datos, mientras que un número muy grande
puede dejar sin observaciones algunas de las clases Limitando de esta forma su
uso.

3.2 DEFINICIONES DE FECUENCIAS

 FRECUENCIA ABSOLUTA
Su valor indica el número de veces que los datos de la muestra caen en una
determinada clase .se representa por fi para una muestra de tamaño “n” y con “
k “ clase se cumple que la sumatoria de todas las frecuencias absolutas es igual
a “n” es decir :
k
∑ fi =n
i=1

Siendo
f i = valor que toma la frecuencia absoluta en la i-esima clase
n = tamaño de la muestra
k= número de clase

 FRECUENCIA RELATIVA
Su valor indica la proporción o porcentaje de la muestra contenida en la clase. Se
representa por h i y se obtiene al dividir la frecuencia absoluta por el tamaño de
la muestra, es decir :

h i = f i ( en proporción )
n

h i= f i x 100 % ( en porcentaje )
n

23
En ambos casos se cumple que :

Nota k
∑ f i = h i = 1 o 100%
i=1

 FRECUENCIA ABSOLUTA ACUMULADA


Se obtiene al acumular los valores de las frecuencias absolutas para cada clase.
Un valor cualquiera indica que parte de la muestra , tiene valores menores o
iguales al valor que toma la variable en estudio .Se presenta por F i y se obtiene
por
k

F= ∑ f i = i = 1 ,2,…….K
i=1

k
Nota F= ∑ f i = n
i=1

El valor de F k nos indica la cantidad de datos menores o iguales al valor de i-


esima clase.

 FRECUENCIA RELATIVA ACUMULADA


Se obtiene al acumular los valores de las frecuencias relativas para cada clase.Su
valor indica la proporción o porcentaje de la muestra que tiene valores menores
o iguales al valor de la variable. Se representa por H i.
También se obtiene dividiendo cada valor de la frecuencia acumulada absoluta
por el tamaño de la muestra, es decir:

H = F i = 1,2,……….. k
n
Nota: H k = 1 o 100%
El valor de H K nos indica la proporción o porcentaje de datos , menores o
iguales al valor de la i- esima clase

 MARCA DE CLASE
El concepto de marca de clase solo se usa cuando se elabora una tabla de
distribución de frecuencias para una variable cuantitativa continua , y su
interpretación matemática corresponde al punto medio para una determinada
clase . Estadísticamente corresponde al valor representativo para todos los datos
que caen en esa clase .Se calcula usando la formula:

X i = Límite inferior + límite superior

24
2

3.2.1 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA.

Cuando los datos corresponde a una variable cualitativa (Nominal o


jerárquica) la tabla de distribución de frecuencia tiene la siguiente forma:

TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO

1 Variable fi hi
2 C1 f1 h1
3 C2 f2 h2

K C fk hk
TOTAL N 1

FUENTE: ENTIDAD QUE PROPORCIONA LOS DATOS


Los valores C i corresponde a los valores que toma la variable ( clase).

Si la variable es nominal no existe un orden entre sus valores, en


cambio si la variable en estudios es jerárquica debe tomarse en cuenta
el orden de sus valores, ya sea en forma ascendente y descendente.
Para esta variable se presentan algunos tipos de gráficos, pero los más
frecuentes es el grafico de barras verticales u horizontales, grafico circular
gráfico de líneas y graficas pictóricos.

Ejemplo:
Con la finalidad de estudiar la variable x= Preferencia a determinados
Marcas de jabones de tocador por las estudiantes -PNP, se toma una
muestra aleatoria conformada por 30 estudiantes , los resultados son :

Rexona Palmolive rexona camay Palmolive lux


Camay lux lux rexona camay lux
Camay rexona camay lux lux camay
Lux camay rexona rexona camay lux
lux camay Palmolive lux lux

FUENTE PACOCHA S.A

Solución:

Para este ejemplo la tabla de distribución de frecuencias es :

DISTRIBUCION DE FRECUENCIAS SOBRE PREFERENCIA A MARCAS


DE JABONES DE TOCADOR POR LOS 30 ESTUDIANTES -PNP

25
I Jabones de F h h%
tocador
1 Rexona 6 0.2 20%
2 Camay 9 0,3 30%
3 Lux 12 0,4 40%
4 palmolive 3 0,1 10%
Total 30 1.0 100%
FUENTE : PACOCHA S.A

Calcular e interpretar:
f 2 : 9 alumnos encuestados prefieren el jabón de tocador camay
h 2 : 30% de las estudiantes encuestados prefieren el jabón de tocador
Camay

GRAFICA DE BARRAS
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ESTUDIANTES PNP

frecuencia absoluta
f

12

FUENTE 3
PACOCHA
S.A.
rexona camay lux palmolive

GRAFICA CIRCULAR
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ESTUDIANTES PNP

frecuencia absoluta
3

10% 6
26
20%
rexona
camay
lux
12 9
40%
30%

SESIÓN 4
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Y NO AGRUPADOS

4.1 TABLA DE DISTRIBUCION DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA


DISCRETA.
Cuando los datos corresponden a una variable cuantitativa discreta la tabla
de distribución de frecuencias tiene la siguiente forma :

TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO

Variable F h F H
1 C1 f1 h1 F1 H1
2 C2 f2 h2 F2 H2

K Ck fk hk Fk Hk
Total N 1
FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS

Los valores C1 corresponden a valores que toma las variables ( clase )

Ejemplo :
Los siguientes datos corresponden a una muestra aleatoria de 50 tiendas
Que se dedican a la venta de gas con la finalidad de analizar la variable
Y= Número de balones de gas vendidos en un día determinado, los
Resultados son :

21 23 24 23 24 21 24 23 24 22 22 24
21 22 24 22 24 25 26 25 24 23 23 21
23 23 22 24 26 26 22 23 22 24 21 25
22 23 25 26 24 22 25 24 25 21 26 23
25 24

Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos


DISTRIBUCION DE FRECUENCIAS DEL NUMERO DE BALONES DE GAS
27
VENDIDOS POR 5O TIENDAS

Variable F h F H
1 21 6 0,12 6 12
2 22 9 0,18 15 30
3 23 10 0,20 25 50
4 24 13 0,26 38 76
5 25 7 0,14 45 90
6 26 5 0,10 50 100
Total 50 1.00
FUENTE: SOL GAS S.A

Hallar e interpretar:
f 3 = 10 significa que 10 tiendas , tienen una venta de 23 balones de gas
h 3 = 20% significa que el 20% , de las tiendas tienen una venta de 23
balones de gas.
GRAFICA DE BASTONES

13

10
6 9 7 5

0
21 22 23 24 25 26

Fuente sol de gas

GRAFICA DE BARRAS

frecuencia
Variable f

25 26
23 24
21 22

13
28
9 10
6 7
5
1 2 3 4 5 6

4.2 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE


CUANTITATIVA CONTINUA

Cuando los datos corresponden a una variable cuantitativa continua la


tabla de distribución de frecuencias tiene la siguiente forma :
TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO
Variable F h F H
1 C1 f1 h1 F1 H1
2 C2 f2 h2 F2 H2

K Ck fk hk Fk Hk
Total N 1

FUENTE : ENTIDAD QUE PROPORCIONA LOS DATOS

Los valores C 1 corresponde a valores que toma la variable ( clases )

Ejemplo :
Una muestra aleatoria de tamaño n= 34, es tomada con la finalidad de estudiar
La variable W = peso del recién nacido en la Maternidad de Lima. Los resultados en
kg. Se presentan a continuación.

1.5 1.5 1,9 2.0 2,1 2,1 2.3 2.4 2,5 2,5 2,6
4.1 2.7 2.8 2.9 3,0 3,1 3,1 3,2 3,2 3,2 3,2
3.3 3,3 3.3 3.4 3.4 3,5 3,6 3,6 3,7 3,7 3,9
4.1
FUENTE : Maternidad de Lima

Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos


Cuando los datos pertenecen a una variable cuantitativa continua, las clases C I
Corresponde a intervalos de la forma [ a ; b > llamados intervalos de clases
siendo a y b el límite inferior y superior respectivamente del intervalo de clase

PROCEDIMIENTO PARA ELABORAR UNA TABLA DE FRECUENCIA PARA


UNA MUESTRA DE TAMAÑO “n”

29
a. Calculo de Rango “R”
R = dato mayor – Datos Menor
Para el cálculo de datos se tiene
R= 4.1 – 1.5 = 2,6

b. Calculo del número de clase


Para el cálculo del número de clase para una tabla de distribución de
frecuencias se hará usando la regla de STURGES
K = 1 +3.3 Log (n)
K= 1 +3,.3 log 34 = 6.053
como el valor que toma K debe ser un numero entero , se usa el redondeo
Simple k = 6

Observación.-
El redondeo simple significa, que si un numero tiene como primer decimal
un número mayor o igual a 5 . Entonces la cifra entera del número se
incrementa en una unidad.

Ejemplo
Si, k= 6.7 usando el redondeo simple k= 7
Si k = 6.4 usando el redondeo simple k = 6

c.-. CALCULO DEL ANCHO DEL INTERVALO DE CLASE ( C )


R
C=
K
2 ,6
C= =0,43333
6

El valor que toma el (C ) debe de tener el mismo número de decimales de


los datos originales y a la vez su valor debe tener un redondeo por exceso
(incrementar en la unidad al último decimal).

Para determinar los intervalos de clase es como sigue:


 El dato menor corresponde al límite inferior de la primera clase y para obtener el
límite superior de esta primera clase se suma al límite inferior el valor del ( C )
 El límite inferior del segundo, intervalo de clase , corresponde al límite superior
del primer intervalo de clase y para obtener su límite superior , al límite inferior
de esta clase se le añade el (C) y así sucesivamente hasta completar las “k” clases

Tabla de distribución de pesos (kg) de recién nacidos registrados en la


Maternidad de Lima .

i Pesos (kg) fi hi Fi Hi Xi
1 [1,5 -2,0 > 3 0,088 3 0,08 1,75
2 [2,0 -2,5> 5 0,147 8 0,235 2,25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3.0-3,5> 12 0,35 26 0,761 3,25
5 [3,5-4,0> 6 0,176 32 0,931 3,75

30
6 [4,0-4,5] 2 0,058 34 0,989 4,25
34 1.00

Hallar e interprete los siguientes valores:


f3=6 (Significa que hay 6 recién nacidos que tienen un peso igual o mayor a 1.5
kg , pero menor a 2.0 kg)
h3=17.6% (Significa que el 17.6% de los recién nacidos tienen un peso igual o
mayor a 1.5 kg , pero menor a 2.0 kg)
F3= 14 (Significa que hay 14 recién nacidos tienen un peso igual o mayor a 1.5 kg ,
pero menor a 3.0 kg)

H3=41.10% (Significa que el 41.10% de los recién nacidos que tienen un peso
igual o mayor a 1.5 kg , pero menor a 2.0 kg)
H3 – H2= 52.9% (Significa que el 52.9% de los recién nacidos que tienen un peso
igual o mayor a 2.5 kg , pero menor a 3.5 kg)
X´2=2.25 (Significa que 2.25 kg es el peso representativo para los recién nacidos
que tienen un peso mayor o igual 2.0 kg , pero menor a 2.5 kg)

2. ¿Cuántos recién nacidos aproximadamente tienen un peso menor a 2.8 kg?


Por interpolación lineal (utilizando la columna de las frecuencias absolutas
Acumuladas)
Límite superior Frecuencias acumuladas
de los pesos absolutas (menor que)

2.5 8 (un peso menor a 2.5 kg se


encuentran 8 recién nacidos
2.8 x (un peso menor a 2.8kg se
encuentran x recién nacidos)
3.0 14 (un peso menor que 3.0 kg se
encuentran 14 recién nacidos
Utilizando la interpolación lineal (semejanza de triangulo) se tiene:

3.0 – 2.5 = 14 - 8 → x= 11.6 ≈12 (usando redondeo simple)


2.8 – 2.5 x – 8
Aproximadamente 12 recién nacidos tiene un peso menor a 2.8 kg
3. ¿Qué porcentaje de los recién nacidos tiene un peso inferior a 2.8 kg

Como 11.6 recién nacidos tienen un peso inferior a 2.8 kg, entonces

→x=
Tiempo 11.6 →
(min) fi hi Fi F*i Hi 11. 6 x
100% =
2–4 3 0,10 3 30 0,10
34.12%
4–6 6 0,20 9 27 0,30 34
6–8 12 0,40 21 21 0,70
8 – 10 7 0,23 28 9 0,93
31
10 – 12 2 0,07 30 2 1,00
Total 30 1,00
Gráficas

GRÁFICA DE BARRAS
12
12

10
7
8 6
6 fi
3
4 2
2

0
02-Abr 4 –6 6 –8 8 – 10 10 – 12

GRÁFICA DE LA OJIVA
Para construir la Ojiva en el eje de la abscisa se colocan los intervalos de clase y en eje
de la ordenada las frecuencias acumuladas absolutas o frecuencias acumuladas
relativas.
Por ejemplo la gráfica de la Ojiva para los pesos de los recién nacidos se obtiene de la
siguiente manera , cero recién nacidos tiene un peso menor a 1.5 kg, 3 recién nacidos
tiene un peso menor a 2 kg, 8 recién nacidos tienen un peso menor a 2.5kg , 14 recién
nacidos tienen un peso menor a 3.0 kg, 26 recién nacidos tienen un peso menor a 3.5
kg, 32 recién nacidos tiene un peso menor a 4.0 kg. y 34 recién nacido tienen un peso
menor a 4,5 kg uniendo estos puntos se obtiene la curva creciente a la derecha
llamada la Ojiva ( “Menor que “)

32
30

25

20

15

10

0 2 4 6 8 10 12 14

GRAFICA DE LA OJIVA ( “ MENOR QUE ” )

Supongamos que la variable en estudio es el tiempo (minutos) que utiliza un usuario


en realizar una transacción bancaria.

Tiempo
(min) fi hi Fi F*i Hi

2-4 3 0,10 3 30 0,10


4–6 6 0,20 9 27 0,30
6–8 12 0,40 21 21 0,70
8 – 10 7 0,23 28 9 0,93
10 – 12 2 0,07 30 2 1,00

Total 30 1,00

33
30

25

20

15

10

0 2 4 6 8 10 12 14
GRAFICA DE LA CURVA (MAYOR QUE)

TABLA QUE PROPORCIONA EL NUMERO DE CLASES


PARA UN TAMAÑO DE MUESTRA DADO

Tamaño de la Numero de clases

muestra K=1+3.3 Log (n)


20 a 23 5
24 a 46 6
47 a 93 7
94 a 187 8
188 a 376 9
377 a 756 10
757 a 1519 11
1520 a 3053 12
3054 a 6135 13
6136 a 12328 14
12329 a 24770 15
Nota:

34
Otra metodología para determinar el ancho del intervalo de clase ( C ).

1. Determinación de rango R
R= dato máximo-dato mínimo
2. Determinación de numero de clases K
K= 1+ 3.3 log (n)
3. Determinación de ancho del intervalo de clase ( C )

C= R → Debe redondearse por defecto


K El mismo número de decimales de los datos

C redondearse por defecto casi siempre se comete error

i) 0 → El dato de arranque para la tabla= dato mínimo

E= ( C) k-R ii) > 0 → El dato de arranque para la tabla =Dato mínimo _ E


2
iii) < 0 →El número de clases se incrementa en 1 y se sigue (i o ii)

Ejemplo
La mayor y menor estatura de 50 personas es respectivamente 1.72 mts y 1.55 mts.
Calcular el número de clases y su ancho para construir la tabla de distribución de
frecuencias.

Solución:
1. Determinación de rango R= 1.72-1.55=0.17
2- Determinación de número de clases
K= 1+3.3 log (50)= 6.6= 7 Redondeo por simple
3.-Determinacion de ancho de clase
C= 0.17 = 0,0242 = 0.02
7
Al redondearse se comete error
E= 0.02 * 7 – 0.17 = -0.03
Agregamos una nueva clase k= 8
C= 0.17 = 0.0212 = 0.02
E= 0,02 * 8 – 0,17 = - 0 , 01
Agregamos una nueva marca de clase k= 9
C= 0,17 = 0,0188 = 0,02
9
E = 0.02 * 9 -0.17 = 0.01

Dato de arranque =1.55 – 0.01 = 1.545 = 1.55


2

35
Los intervalos de clases para esta tabla son :
Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50

Si usamos la metodología anterior, los intervalos de clase para la tabla sería

Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50
Se observa que las seis primeras clases contienen los datos, la 7ma clase carece de
datos.

Nota:
No existe una formula única para determinar el número de clase (k) en la construcción
de una tabla de distribución de frecuencias. Un número muy pequeño de clases tiende
a ocultar la distribución real del conjunto de datos, mientras que un número muy
grande puede dejar sin observaciones algunas de
Las clases, limitando de esta forma su uso. La idea es tener un numero de clases de tal
forma que todos los datos se encuentren en las clases formadas y además nos permite
conocer la distribución empírica de los datos , Se sugiere que el número de ellos debe
variar entre 5 y 15.
Nota:
Para determinar el número de clases ( k) también se pueden usar otras fórmulas tales
como :
K= Log 2 ( n)
K=√n
Nota:
Para determinar el número de clases para la tabla el investigador puede utilizar algún
criterio sostenido

36
EJEMPLOS DE APLICACIÓN:
Ejemplo de aplicación 1.

La siguiente información corresponde al tipo de denuncias registradas en la


comisaría de San Bartolo, en el mes de marzo del 2019.

homicidio muerte suicidio homicidio


aborto muerte suicidio homicidio
maltrato familiar muerte homicidio aborto
maltrato familiar muerte abandono muerte
muerte suicidio muerte homicidio
aborto aborto maltrato familiar muerte
muerte aborto aborto
homicidio abandono maltrato familiar

muerte muerte maltrato familiar

maltrato familiar aborto maltrato familiar

maltrato familiar maltrato familiar homicidio


maltrato familiar maltrato familiar muerte

a) Construir la tabla de distribución de frecuencia.


b) Interpretar cada una de las frecuencias

Solución:

La variable de estudio será:


Xi : Tipo de denuncias registradas en la comisaría de San Bartolo, en el mes de
marzo del
2019.

Tabla de distribución de frecuencia, sobre los tipos de denuncias


registradas en la comisaría de San Bartolo, marzo del 2019

i Tipo de denuncias fi h i (%)

1 Abandono 2 0.048
2 Aborto 7 0.167
3 Homicidio 7 0.167
4 Maltrato familiar 11 0.262
5 Muerte 12 0.286
6 Suicidio 3 0.071

37
Total 42 1.000

Fuente: Comisaria de san Bartolo

INTERPRETACIÓN

FRECUENCIA ABSOLUTA SIMPLE

f 1: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 2 denuncias por abandono.
f 2: según la información redactada en la comisaría del distrito de san Bartolo en el
mes de marzo del 2019, se ha registrado 7 denuncias por aborto.

f 3: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 7 denuncias por homicidio.

f 4: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 11 denuncias por maltrato familiar.

f 5: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 12 denuncias por muerte.
f 6: según la información redactada en la comisaría del distrito de san Bartolo en el
mes de marzo del 2019, se ha registrado 3 denuncias por suicidio.

FRECUENCIA RELATIVA SIMPLE

h 1: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 4.8% de denuncias por abandono.

h 2: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 16.7% de denuncias por aborto.
h 3: según la información redactada en la comisaría del distrito de san Bartolo en
el mes de marzo del 2019, se ha registrado 1 6.7% de denuncias por homicidio.

h 4: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 26.2% de denuncias por maltrato
familiar.

h 5: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 28.6% de denuncias por muerte.

h 6: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 7.1% de denuncias por suicidio.

Ejemplo de aplicación 2.

La siguiente información corresponde a las denuncias contra la vida el cuerpo y la


s a l u d r egistradas p o r l a D I R I N C R I -PNP, en el cuarto trimestre del
año 2010.

38
a) Construir la tabla de distribución de frecuencia
correspondiente.
b) Interpretar cada una de las frecuencias

Solución:

La variable de estudio será: Xi : Tipo de denuncias contra la vida el cuerpo y


la salud.

Tabla de distribución de frecuencia sobre las denuncias contra la vida el


cuerpo y la salud registradas por la DIRINCRI-PNP, año
2010.
Denuncias contra la vida Frecuencia Absoluta el Frecuencia
cuerpo y la salud Simple Relativa Simple
fi h
i
Homicidio 121 0
Muertes 114 .0
Suicidios 23 .0
Abortos 38 .0
Lesiones 384 .0
Exposición de. 26 .0
personas a peligro .
Abandono de 8 0
personas en peligro .

TOTAL 714 1
FUENTE: Dirección de Investigación Criminal – PNP (Anuario Estadístico 2010)

INTERPRETACIÓN

FRECUENCIA ABSOLUTA SIMPLE

f1 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 121denuncias por homicidios.

f2 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 114 denuncias por muerte.

f3 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 23 denuncias por suicidios.

f4 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 38denuncias por abortos.
f5 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 384 denuncias por lesiones.

39
f6 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 26 denuncias por Exposición de
personas a peligro.

f7 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 8 denuncias por Abandono de
personas en peligro.

FRECUENCIA ABSOLUTA SIMPLE

h1 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 17% de denuncias por homicidios.

h2 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 16% de denuncias por muerte.
h3 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 3% de denuncias por suicidios.

h4 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 5% de denuncias por abortos.
h5 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 54% de denuncias por lesiones.

h6 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 4% de denuncias por Exposición de
personas a peligro.
h7 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 1% de denuncias por Abandono de
personas en peligro.

40
EJERCICIOS PROPUESTOS

1. Usando la tabla de distribución de frecuencia de los pesos de los recién nacidos


a. ¿Cuántos recién nacidos aproximadamente tienen un peso superior a 2.8 kg.
b. ¿Cuántos recién nacidos aproximadamente tienen un peso entre 2.2kg y 3.4 kg
c. ¿Cuál es el mínimo peso para que un recién nacido se encuentre
considerado dentro del 20% de los que tienen pesos altos ?
d. ¿Cuál es el máximo peso para que un recién nacido se encuentre
considerado dentro del 20% de los que tienen pesos bajos ?
e. ¿Qué porcentaje de los recién nacidos tienen un peso superior a 3.2 kg.?
f. ¿Qué pesos encierran al 80% central de los pesos de los recién nacidos ?
g. Hallar el mínimo peso, para que un recién nacido este considerado dentro del 25%
de los que tiene mayores pesos .
h. Entre que valores se encuentra el 50% central de los pesos de los recién nacidos.
i. Calcular el peso total aproximado de todos los recién nacidos
j. Después de cierto tiempo, los que tenían un peso menor a 3 kg incrementan su
peso en un 25% mas ¼ de kg. y los que tenían un peso mayor o igual a 3 kg. Se
incrementan en un 5%. más ¼ kg. Hallar el nuevo peso total aproximado de todos los
recién nacidos
k. Suponiendo que los datos de la tabla presentan las siguientes transformaciones, los
datos con un peso menor a 3 kg. Incrementándose en un 12% y los datos con pesos
superiores o iguales a 3 kg. Se incrementan en un 20% ambos con respecto a los pesos
iniciales. ¿ Hallar el peso total después del incremento .
2.Una serie de 50 datos tiene como variable en estudio , los montos por venta en miles
de nuevos soles, siendo el monto mínimo 85 y el monto mayor 129. Establecer las
clases para la tabla.
3. Un conjunto de 50 datos, tiene como variable en estudios los pesos de cajas, Siendo
el peso mínimo 43.43 Kg. y el peso máximo 68.15 kg. Establecer las Clases para la
tabla.
4. Los datos que a continuación se presentan, corresponden a una muestra Aleatoria
de 40 frascos conteniendo mermeladas de fresa , el objetivo es Estudiar su peso (grs)

149 164 171 176 181 185 187 190


156 165 172 176 182 186 187 194
157 165 174 176 183 186 188 196
158 168 175 180 183 187 188 198
162 170 175 180 184 187 189 202

a. Elaborar la tabla de distribución de frecuencias y hacer los gráficos


Correspondiente, histograma, polígono de frecuencia, y ojiva use la regla de STURGES.
b. Hallar e interprete: H 5 – H 3
c. Usando la tabla de distribución de frecuencias, cual es el peso mínimo que debe
tener un frasco, para estar considerado dentro del 15% de los de mayor peso.

41
UNIDAD III

SESIÓN 5
MEDIDAS DE TENDENCIA CENTRAL

Introducción
En esta unidad se estudia las principales medidas de tendencia central o de posición
central, las cuales se definen como aquellos valores que representan al conjunto de
datos de una variable en estudio. Se presenta el cálculo de las medidas de tendencia
central para datos agrupados, y datos no agrupados, así como también sus
propiedades.

5.1 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION CENTRAL

Son valores estadísticos calculados con los datos de la muestra o de la población y que
tienden a ubicarse en el centro de la distribución de los datos.
A estas medidas se les considera como valores representativos para el conjunto de
datos
Si estos valores son calculados usando todos los datos de la muestra, se les llama
valores estadísticos, estadígrafos o estimados; en cambio sí son calculados usando
todos los datos de la población, se les llama parámetros.
Las medidas de tendencia central más usadas son:
1. La media aritmética o simplemente media o promedio
2. La mediana
3. La moda

5.2 LA MEDIA ARITMETICA


Es un valor que tiende a ubicarse en el centro de la distribución de los datos, y es
considerado un valor representativo para el conjunto de datos, cuando su
distribución es simétrica o los datos presentan poca variabilidad.
Su valor se calcula tanto para la muestra (valor estadístico) como para la población
(parámetro).

LA MEDIA ARIMÉTICA PARA LA POBLACION


Sea X una variable en estudio que toma valores x1, x2, x3,….., xN , la media aritmética
para la población se simboliza universalmente con la letra griega µ(se lee “mu”) y es
igual a la sumatoria de todos los datos de la población divididos por el total de ellos

µ=

Nota: El valor de la media aritmética para la población (parámetro) casi nunca se


conoce, el objetivo es estimar su valor, a través de la media aritmética muestral.

Ejemplo:

42
Supongamos que se tienen todos los pesos en kg de 3.546 varones adultos de una
empresa minera, siendo estos:
65,5 70,5 69,5 70,0 71,0 ……………68,5
Hallar su peso promedio e interprete

65 ,5+ 70 ,5+69 , 5+70+71+...+68 ,5


3.546
µ= = = 68,2 kg

Por lo tanto 68,2 kg, será el peso promedio para todos los trabajadores de la empresa
es decir el parámetro.

LA MEDIA ARIMÉTICA PARA LA MUESTRA


Se X una variable en estudio que toma valores x1, x2, x3,….., xn, la media aritmética
para una muestra se simboliza universalmente con la letra ( se lee x-barra) y su valor
es igual a la sumatoria de todos los datos de la muestra divididos por el total de ellos.
n

∑ Xi
1
¿
n
.

Es la media aritmética para datos sin agrupar. Al valor de la media aritmética, también
se le conoce como la media aritmética muestral.

Ejemplo
Los siguientes datos corresponden a los pesos (kg) , de 8 personas adultas de sexo
varón:
60,5 68,5 58,5 70,5 70,0 68,5 72,0 71,0
Calcular e interpretar la media aritmética

60 ,5+ 68 ,5+58 ,5+70 , 5+70+68 , 5+72+71


6
= = = 67,4 kg

Interpretación
La media es: 67,4 kg es el peso promedio de 8 varones adultos, por lo tanto este valor
representa a los pesos de los 8 varones; supongamos que los 8 varones adultos son
elegidos al azar de una población de varones adultos, entonces se puede concluir que
el peso promedio de los varones adultos en la población es de 67,4 kg

PROPIEDADES DE LA MEDIA ARIMÉTICA MUESTRAL


La media aritmética para la muestra, tiene las siguientes propiedades:

43
1. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y , la media aritmética,
definimos a una DESVIACIÓN (di)como la diferencia entre un dato xi de la muestra
y su media aritmética ; es decir: di = x i -

Entonces la sumatoria de todos los valores di es igual a cero; esto es:


n

=∑
¿¿
i=1

2. La suma de los cuadrados de las desviaciones con respecto a la media aritmética, es


siempre un valor mínimo; es decir
n

∑ ¿¿
= i=1 es siempre un valor mínimo
3. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y , la media aritmética, sea la
combinación lineal yi = axi ± b; entonces la media aritmética para variable Y es:
=a ±b

4. Sea una muestra de tamaño “n” , dividida en “k” submuestra de tamaño n1, n2……nk ,
y x̄ 1 , x̄ 2 , x̄ 1 , , …¯ … … , x̄ k, la media aritmética de cada submuestra; entonces la media
aritmética de la muestra se calcula por:


=
A esta medida se le conoce como la media ponderada
LA MEDIA ARIMETICA PARA DATOS AGRUPADOS
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada
clase se le asigna su frecuencia correspondiente.
Cuando los datos se encuentran en una tabla de distribución de frecuencias la media
aritmética se calcula de la siguiente fórmula
k

∑ x 'i f i
= i=1
n
Donde:
K= número de clases

= Marca de clase i-ésima clase (corresponde a la ponderación)


fi= Frecuencia absoluta de la i-ésima clase

Otra fórmula que se puede utilizar para calcular la media aritmética para datos
agrupados, es en función de las frecuencias relativas
n
=∑ x i hi
'

i=1

44
Nota:
Las propiedades de la media aritmética para datos sin agrupar, se cumplen también
para datos agrupados.

Ejemplo
Sea la tabla para los datos agrupados de los pesos (kg) de los recién nacidos. Hallar e
interpretar la media aritmética:

i Pesos fi hi Fi Hi

1 [1,5 -2,0 3 0,09 3 0,09 1.75

2 [2,0-2,5 5 0,15 8 0,24 2.25

3 [2,5-3,0 6 0,176 14 0,416 2.75


4 [3,0-3,5 12 0,35 26 0,746 3.25

5 [3,5-4,0 6 0,176 32 0,922 3.75


6 [4,0-4,5] 2 0,05 34 1 4.25
TOTAL 34

=
∑ x 'i f i
=
i=1
n
Interpretación:
La media es 3.029kg es el peso promedio representativo para los recién nacidos de la
maternidad de Lima

VENTAJAS Y DESVENTAJAS DE LA MEDIA ARIMÉTICA

VENTAJAS
a. Es fácil de calcular e interpretar su valor
b. La suma de las desviaciones es cero
c. La suma de las desviaciones al cuadrado siempre es mínima

DESVENTAJAS
a. Su valor se encuentra afectado por datos extremos (datos muy altos o datos
muy bajo de lo común); es decir estos datos tienden a alterar su valor
b. Deja de ser un valor representativo para la muestra cuando los datos
presentan mucha variabilidad.
c. No se puede calcular en tabla con extremos abiertos
d. Para datos con distribución asimétrica, no debe usarse como medida
representativa

45
5.3 LA MEDIANA (Me o Md)
La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor. La mediana se puede hallar solo para variables
cuantitativas.

Su aplicación se ve limitada, ya que solo considera el orden jerárquico de los datos y no


alguna propiedad propia de los datos, como en el caso de la media aritmética.

VENTAJAS Y DESVENTAJAS DE LA MEDIANA

VENTAJAS
1. Es fácil de calcular e interpretar su valor
2. Se realizan manipulaciones algebraicas
3. Su valor no se encuentra afectado por datos extremos
4. Se puede calcular en tablas de distribución de frecuencias con extremos abiertos

DESVENTAJAS
La suma de los cuadrados de las desviaciones con respecto a la mediana no es mínima,
en comparación con la media aritmética

5.3.1 PARA DATOS NO AGRUPADOS

PARA UN NÚMERO DE DATOS IMPAR


La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su
posición se aplica la siguiente ecuación:
Se ordenan los datos de menor a mayor.
La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su
posición se aplica la siguiente ecuación:

Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadística evaluadas
sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6

Solución:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuación:

46
La mediana es el valor de x5 (quinto dato), es decir, Md=8

PARA UN NÚMERO DE DATOS PAR


La mediana es la media aritmética de los dos datos que se encuentran a la mitad de la
lista. Para calcular su posición se aplica la siguiente ecuación:

Ejemplo:
Calcular la mediana de las siguientes calificaciones del curso de Matemática evaluadas
sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solución:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuación

5.3.2 CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS

PARA DATOS AGRUPADOS EN TABLAS DE FRECUENCIA PAR O IMPAR

Para calcular la posición de la mediana se aplica la siguiente ecuación:

Ejemplo:
Dados los siguientes 20 números:
1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5 y 5 x fi

1) Agrupar los datos en tabla de frecuencia. 1 1


2 3
Solución: 3 2
4 4
47
5 8
6 2
Total 20
2) Calcular la mediana.

Solución:
Calculando la posición de la mediana se obtiene:

Como la posición de la mediana es 10,5, su valor es el promedio de los datos décimo y


undécimo. Para observar con claridad cuáles son los datos décimo y undécimo se
aconseja calcular la frecuencia acumulada.
x f fa
1 1 1
2 3 4
3 2 6
4 4 10
5 8 18
6 2 20
Total 20
Se observa que el décimo dato es 4 y el undécimo es 5, por lo tanto:

PARA DATOS AGRUPADOS EN INTERVALOS

a) POR INTERPOLACIÓN VARIABLE CUANTITATIVA CONTINUA


Ejemplo:
Calcular la mediana de los pesos de un grupo de 50 personas que se distribuyen de la
siguiente manera:
Intervalos f
[45,55) 6
[55, 65) 10
[65, 75) 19
[75, 85) 11
[85, 95) 4
Solución:
Primero se calcula n/2 y después se averigua el intervalo en el que está la mediana,
este intervalo recibe el nombre de intervalo o clase de la mediana. Para averiguar el
intervalo en el que está la mediana se aconseja calcular la frecuencia acumulada.

Intervalos f fa
[45,55) 6 6
[55, 65) 10 16

48
[65, 75) 19 35
[75, 85) 11 46
[85, 95) 4 50

En este ejemplo el intervalo de la media es [65,75).


Se observa que 16 valores están por debajo del valor 65.
Los 9 que faltan para llegar a 25 se interpolan en el ancho del intervalo de la mediana
que en este ejemplo es 10.

Aplicando regla de tres:


Si 19 corresponde a 10 valores del intervalo
A 9 corresponde a X

Por lo tanto, la Mediana es igual a 65 + 4,737 = 69,737

EJERCICIOS DESARROLLADOS

Hallar la mediana.
Ejercicio 1. Se tienen los valores:
3 ; 2; 9; 5; 6
Solución: Ordenando
2, 3, 5 , 6. 9
La Me = 5 (Como la cantidad de números es impar, la Mediana es el termino
central=(5+1)/2 =3  el tercer término)

Ejercicio 2. Se tienen los valores:


5; 3; 1; 6; 7; 2; 9, 8
Solución: Ordenando , el termino será = (8+1)/2=4,5  entonces se toman los
números 5 y 6.
1, 2, 3, 5, 6, 7, 8, 9,
Me= 5 + 6 = 5.5
2
Si es par se ordena de menor a mayor y hallamos la semisuma de los datos centrales

Ejercicio 3.
La cantidad de usuarios que concurren a un centro de información durante la semana
es:
230 220 250 228 240 1200
Hallar el valor de la mediana de la concurrencia de usuarios

Solución: Ordenando
Ordenando los datos en forma ascendente
220 228 230 240 250 1200

49
230+240
Me= =235
2

Interpretación:

El 50% de las cantidades de usuarios que concurren al centro de información durante


los días de la semana es menor o igual a 235, y el otro 50% de las cantidades es
superior a 235 usuarios

Ejercicio 4.
Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 alumnos de la
Escuela de Suboficiales:
1.71 1.69 1.72 1.69 1.68 1.70 1.73

Solución:
Ordenando las estaturas: 1,68 1,69 1,69 1,70 1,71 1,72 1,73

Como n=7, entonces: =


Interpretación:
El 50% de las estudiantes tienen estaturas menores o iguales a 1,70 mts. Y el otro 50%
de las estudiantes tienen estaturas superiores a 1,70 mts

EJEMPLOS DE CÁLCULO DE LA MEDIANA PARA LOS DATOS AGRUPADOS PARA UNA


VARIABLE CUANTITATIVA DISCRETA Y CONTINUA

Ejemplo: para una VARIABLE CUANTITATIVA DISCRETA

En la siguiente tabla de distribución de frecuencias, la variable en estudio X


corresponde al número de balones de gas vendidos diariamente por 50 tiendas. Hallar
el valor de la mediana del número de balones de gas vendidos diariamente

i X fi
1 22 9
2 23 10
3 21 6
4 25 7
5 26 5
6 24 13

50
TOTAL 50

Ordenando los valores que toma la variable X, y obtenemos el valor de las frecuencias
absolutas acumuladas

i X fi Fi
1 21 6 6
2 22 9 15

3 23 10 25(X26X38)

4 24 13
5 25 7 45
6 26 5 50
TOTAL 50

n= 50 ( par) me = x 25 + x 26 = 23 + 24 = 23,5
2 2 2
Interpretación:
El 50% de las tiendas tienen una venta diaria menor o igual a 23,5 balones de gas, y el
otro 50% de las tiendas tienen una venta diaria mayor a 23,5 balones de gas.

b) Por fórmula: VARIABLE CUANTITATIVA CONTINUA

Cuando los datos se presentan en una tabla de distribución de frecuencias, para una
variable continua, el valor de la mediana se calcula haciendo uso de la fórmula:

N - F i-1
Me = Li + 2 x C
fi
Donde :
Li = Límite inferior de la clase que contiene al valor de la mediana
F i-1 = Frecuencia acumulada absoluta de la clase anterior a la clase que
Contiene a la mediana
f i = Frecuencia absoluta de la clase que contiene a la mediana
C = Ancho del intervalo de clase .

Para ubicar la clase que contiene el valor de la mediana se busca en la columna de la


frecuencias acumuladas absolutas o frecuencias acumuladas relativas ( F i o Hi ) el
primer valor que supera a la mitad del número de datos
0 el 50% de los mismos , es decir,

Fi≥ n ó Hi ≥ 0,5

51
2

Ejemplo:
Hallar e interprete el valor de la mediana para la tabla de datos agrupados de los pesos
de recién nacidos.

i pesos fi hi Fi Hi Xi
1 [1,5 -2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2.25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5] 2 0,058 34 0,997 4,25
34 1,00 100%

n= 34 → n = 17 ≤ F i → i = 4
2

N - F i-1
Me = Li + 2 xC
fi
Me = 3 + 17-14 x 0,5 = 3,125 Kg.
12
Interpretación:
El 50% de los recién nacidos tienen pesos menores a iguales a 3,125 kg. y el otro 50%
de los recién nacidos tienen pesos superiores a 3,125 kg

5.4 LA MODA.

Sea x una variable en estudio que toma los valores x1 , x2 ………xn la


moda, es aquel valor de la variable que se presenta con mayor frecuencia,
se representa por ( Mo ) = es decir :

MO = valor que toma la variable para la máxima frecuencia ( f i )

El valor de la moda se interpreta, como el valor más frecuente para el conjunto de


datos de una muestra o población.
El valor de la moda puede o no existir, Si un conjunto de datos tiene una sola moda
a su distribución se le llama unimodal, si tiene dos modas se le llama bimodal y para
más modas multimodal

5.4.1 CÁLCULO DE LA MODA PARA DATOS NO AGRUPADOS

Ejemplo 1.
Hallar la moda para el conjunto de datos:

52
12, 16, 18, 18, 18, 20, 20, 20, 20, 20 , 20 , 24

El dato que se repite con mayor frecuencia es el valor 20, luego la moda es 20.
Ejemplo 2.
Calcular la moda para la serie de datos
1, 1, 2, 3, 3, 4, 7

Los datos que se repiten con igual frecuencia son el 1, y 3 , luego la


distribución tiene dos modas 1, y 3 bimodal

Ejemplo 3.
Calcular la moda para el conjunto de datos : 4 , 2, 3, 7, 5, 9

Como no existe ningún dato que se repite más de una vez, luego el conjunto de
datos no tiene moda (Amodal).

Ejemplo 4.

Una tienda vende durante el día tres tipos de conservas, 120 frascos con
fresa, 40 frasco con mango y 50 frasco con piña, calcular la moda. En este
ejemplo la variable en estudio es tipo de conservas vendidas, luego los
frascos con fresa registraron la mayor venta, por lo tanto, el frasco con fresa
corresponden a la moda.

5.4.2 CALCULO DE LA MODA PARA DATOS AGRUPADOS

Cuando los datos se encuentran en una tabla de distribución de frecuencias


la fórmula para calcular la moda es :

Mo = Li + d1 x C
d 1 + d2
Donde :

Li = Límite inferior de la clase que contiene al valor de la moda


d 1 = f i– f i - 1 = Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase anterior .
d 2= f i– f i + 1 = Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase siguiente.

La clase modal corresponde a la clase de mayor frecuencia absoluta

Ejemplo.
De la tabla de distribución de frecuencia, en la cual se analiza los pesos de los recién
nacidos, Hallar e interprete el valor de la moda.

53
i pesos fi hi Fi Hi Xi
1 [1,5 2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2,25
3 [2,4-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5> 2 0,058 34 0,997 4,25
34 1,00

El valor de la moda se encuentra en la 4ta clase, por presentar la máxima frecuencia


absoluta, en este caso las distribución es unimodal para esta muestra, luego i = 4

d 1 = f i– f i - 1 = f 4– f 5 = 12 – 6 = 6

d 2= f i– f i + 1 = f4 – f 5 = 12- 6 = 6

Mo = Li + d1 x A = M 0= 3 + 6 0,5 = 3,25 kg
d1 + d2 6+6

Interpretación : La Moda es: 3,25 kg. Es el peso más frecuente para los recién nacidos.

SESIÓN 6

PRACTICAS DIRIGIDAS – REPASO

SESIÓN 7
PRIMERA EVALUACIÓN PARCIAL

54
SESIÓN 8
MEDIDAS DE POSICIÓN NO CENTRAL

8.1 MEDIDAS DE POSICION NO CENTRAL


Informan de cómo se distribuye el resto de los valores de la serie.
Los Cuantiles (cuartiles, deciles, percentiles) son medidas de localización, su función es
informar del valor de la variable que ocupará la posición (en tanto por cien) que nos interese
respecto de todo el conjunto de variables. Podemos decir que los Cuantiles son unas medidas
de posición que dividen a la distribución en un cierto número de partes de manera que en
cada una de ellas hay el mismo de valores de la variable.

CUARTILES

Los Cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales (de 25% cada parte). De manera que para resolver
un problema sobre cuartiles solamente tenemos que hallar Q1; Q2 y Q3.
Los Cuartiles, dividen a la distribución en cuatro partes iguales (tres divisiones).
Q1,Q2,Q3, correspondientes a 25%, 50%,75%.

CUARTILES PARA DATOS NO AGRUPADOS:

Pasos a seguir:
1) Ordenar los datos en forma ascendente.
2) Calcular Q2 es decir hallar la Mediana:
 Si la cantidad de datos es impar, el valor que está en el centro será la Mediana,
es decir Q2.
 Si cantidad de datos es par, se suman los 2 datos centrales y se divide entre
3) Calcular Q1 y Q3.
EJEMPLO:
Cálculo de los cuartiles

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresión

55
CASO: NÚMERO IMPAR DE DATOS

CASO : NÚMERO PAR DE DATOS

CUARTILES PARA DATOS AGRUPADOS:

Para hallar los tres Cuartiles (Q) para datos agrupados se aplica la siguiente fórmula:

Donde:
Qk : Cuartil

Li: Límite inferior del intervalo seleccionado.


k: Debe ser 1 ; 2 ó 3
n: Número total de datos
f: Frecuencia absoluta del intervalo seleccionado.

Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la clase cuartil)

a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Cuartil:

Luego en la Columna "F" escoger el primer valor mayor que la clase cuartil
encontrada.
3. Aplicar la fórmula.

56
EJEMPLOS:

1. Encuentra los tres cuartiles de la siguiente Tabla de frecuencias que muestra el


tiempo de servicio de trabajadores de la empresa ABC.

Solución:
Completamos la tabla hallando F:

Encontramos las clase cuartil y la pintamos.

Cuartil 1:

Respuesta: El 25% de empleados tiene 12,7 años de servicio o menos.

Cuartil 2:

57
Respuesta: El 50% de empleados tiene 21,7 años de servicio o menos.

Cuartil 3:

Respuesta: El 75% de empleados tiene 27,8 años de servicio o menos.

DECILES

Los Deciles son los nueve valores de la variable que dividen a un conjunto de datos
ordenados en 10 partes iguales (de 10% cada parte). De manera que para resolver un
problema sobre deciles solamente tenemos que hallar D1; D2 ; D3 ; D4 ; ... D9

Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.

DECILES PARA DTOS NO AGRUPADOS

Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.

1. Ordenamos los datos de menor a mayor.


2. Se busca el lugar que ocupa cada decil mediante la expresión

K . N = 1,2,3,4,5,6,7,8,9
10

58
CASO: NÚMERO IMPAR DE DATOS
6, 8, 7, 2, 3, 5, 4, 6, 2, 6, 10, 8, 11, 1, 2, 5, 5, 1, 12

1, 1, 2, 2, 2, 3, 4, 5, 5, 5, 6, 6, 6, 7, 8, 8, 10, 11, 12

D1 D2 D3 D4 D5 D6 D7 D8 D9

CASO : NÚMERO PAR DE DATOS


6, 8, 7, 2, 3, 5, 4, 6, 2, 6, 10, 8, 11, 1, 2, 5, 5, 1, 12, 13

1, 1, 2, 2, 2, 3, 4, 5, 5, 5, 6, 6, 6, 7, 8, 8, 10, 11, 12, 13

1.5 2 3.5 5 5.5 6 7.5 9 11.5

D1 D2 D3 D4 D5 D6 D7 D8 D9

DECILES PARA DATOS AGRUPADOS

Para hallar los Deciles (D) para datos agrupados se aplica la siguiente fórmula:

Donde:
Dk : Decil
Li: Límite inferior del intervalo seleccionado.
k: Debe ser 1 ; 2 ; 3 ; 4; ... ; 9
n: Número total de datos
f: Frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la clase decil)
a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Decil:

Luego en la Columna "F" escoger el primer valor mayor que la clase Decil encontrada.
3. Aplicar la fórmula.

59
EJEMPLOS:

1. La tabla muestra el peso (en Kg) de los estudiantes de la del “Primer año de la
Escuela Técnica de la PNP”, calcula e interpreta los cuatro primeros Deciles:

Solución:
Completamos la tabla hallando F:

Encontramos la clase Decil y seleccionamos el intervalo del cual tomaremos los datos.

Decil 1:

Respuesta: El 10% de los estudiantes tiene 58,13 Kg de peso o menos.

Decil 2:

Respuesta: El 20% de los estudiantes tiene 65 Kg de peso o menos.

Decil 3:

60
Respuesta: El 30% de los estudiantes tiene 70,94 Kg de peso o menos.

Decil 4:

Respuesta: El 40% de los estudiantes tiene 75 Kg de peso o menos.

PERCENTILES

Los Percentiles son los 99 valores de la variable que dividen a un conjunto de datos
ordenados en 100 partes iguales (de 1% cada parte). De manera que para resolver
un problema sobre percentiles solamente tenemos que hallar P1; P2 ; P3 ; P4; ... ;
P99
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante. El 60 percentil, es aquel valor de la variable
que supera al 60% de las observaciones y es superado por el 40% de las
observaciones. El percentil 99 supera 99% de los datos y es superado a su vez por el
1% restante.

NOTA: Para hallar los Percentiles se sigue el mismo procedimiento que los Cuartiles.

PERCENTILES PARA DATOS AGRUPADOS

Para hallar los Percentiles (P) para datos agrupados se aplica la siguiente fórmula:

61
Donde:
Pk : Percentil
Li: Límite inferior del intervalo seleccionado.
k : Debe ser 1 ; 2 ; 3 ; 4; 5 ; ... ; 99
n: Número total de datos
f : frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la Clase Percentil)
a : Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Percentil:

Luego en la Columna "F" escoger el primer valor mayor que la clase Percentil
encontrada.
3. Aplicar la fórmula

EJEMPLOS:
1. La tabla muestra el consumo semanal de fruta de los pacientes de un hospital,
Calcula e interpreta el Percentil 60 y 90.

Solución:
Completamos la tabla hallando F:

Encontramos las Clase Percentil y seleccionamos el intervalo del cual tomaremos los
datos.
62
Percentil 60:

Respuesta: Semanalmente el 60% de los pacientes consume como máximo 3.5 Kg de


fruta y el 40% restante consume más de 3,5 Kg de fruta.

Percentil 90:

Respuesta: Semanalmente el 90% de los pacientes consume como máximo 5,8 Kg de


fruta y el 10% restante consume más de 5,8 Kg de fruta.

EJERCICIOS PROPUESTOS DE MEDIDAS DE POSCIÓN NO CENTRAL

A. DECILES, CUARTILES Y PERCENTILES CON DATOS NO


AGRUPADOS

1. Las tardanzas de los estudiantes del “Primer año de la ETPNP” fueron de


la siguiente manera. 2, 5, 3, 6, 7, 4, 9. Hallar el cuartil 1 (Q 1) , el
cuartil 2 (Q2) y el cuartil 3 (Q3)
Rpta 3, 5 y 7

2. Las calificaciones de servicio a la comunidad de las estudiantes del


segundo año de la ETPNP fueron considerados del 1 al 10, y arrojaron así:
1, 4, 9, 8, 7, 8, 2, 8 , 9. Hallar Q 3.
Rpta 8.5

3. De las calificaciones anteriores (ejercicio 2). Hallar el D7


Rpta 8

4. Los siguientes datos corresponden a una muestra al azar de efectivos


policiales durante la tardanza del mes de noviembre del 2022.
45, 42, 32, 44, 43, 39, 40, 35, 31

Calcular e interpreta: Q2, D5 y P50

B. DECILES, CUARTILES Y PERCENTILES CON DATOS AGRUPADOS

1. Calcular el segundo decil (D2), cuartil 3 (Q3) y el percentil (P50) de los


sueldos correspondientes a los 80 practicantes de La ETPNP.

63
Sueldos f1
900 – 1200 11
1200 - 1500 13
1500 – 1800 20
1800 – 2100 17
2100 – 2400 15
2400 – 2700 3
2700 - 3000 1

2. La muestra las tallas de un grupo del personal de la PNP de San Bartolo,


arrojaron de la siguiente manera:
Calcula e interpreta el cuartil 2, el decil 4 y el percentil 87

Talla N° de
participantes
1.60 – 1.65 17
1.65 – 1.70 20
1.70 – 1.75 3
1.75 – 1.80 10
1.80 - 1.85 5

3. Los 60 alumnos de la “PROMOCION LIDERES de la EESTP PNP de San Bartolo”,


del curso de Estadística, han sacado las siguientes notas, de los cuales se
solicita el primer cuartil, tercer decil y el percentil 65. Además, interpreta
cada una de ellas.

Notas (x) fi Fi
Li−Ls
10 - 12 14
12 - 14 33
14 - 16 9
16 - 18 1
4. Hallar e Interpretar: Los Q2, D7 y P90 del siguiente estudio que se ha realizado
de
“Robo a banco y entidades financieras 2000 -2011”

Años fi
2000 - 2002 4
2002 – 2004 6
2004 – 2006 6
2006 – 2008 15
2008 – 2010 28
2010 - 2011 31

Fuente: PNP (2000-2011)


Elaboración: DINDES -SENAJU

64
SESIÓN 9
MEDIDAS DE DISPERSIÓN O VARIABILIDAD

RANGO, INTERCUARTIL, DESVIACIÓN MEDIA

Si disponemos de un conjunto de datos u observaciones recogidas para analizar un variable


determinada, así como es muy importante el estudio de indicadores de tendencia, será
conveniente también, evaluar el grado de variabilidad o de dispersión que presentan dichos
datos. Al respecto nos debemos preguntar: ¿El comportamiento de los datos muestra un alto
grado de homogeneidad o, por el contrario, son muy heterogéneos entre sí?

Si los datos son muy semejantes entre sí, podremos observar que no se encuentran muy
dispersos con respecto a la media; es decir los datos no son muy variables; sin embargo,
cuando los datos presentan diferencias importantes entre sí, apreciaremos que tienden a
dispersarse, y de este modo, la información resulta variable o heterogénea. De otro lado, si los
datos fuesen iguales, se dice que no existe variabilidad o dispersión entre ellos

El estudio del grado de variabilidad de los datos que se han recogido es muy importante en
todo análisis estadístico, porqué de éste depende el grado de confiabilidad de las estimaciones
que podamos establecer.

DEFINICIÓN

A los indicadores que se utilizan para analizar el grado de heterogeneidad o de variabilidad de


un conjunto de datos u observaciones, son llamados en general, medidas de variabilidad o
medidas de dispersión.

Las medidas de dispersión son un conjunto de valores que tienen por objeto proporcionar en
un valor único, información sobre la variabilidad que presenta la población o la muestra con
respecto a la variable de interés.

Ejemplo: Supongamos que dos estudiantes han realizado cinco exámenes cada uno. Para
evaluarlos elegimos calcular la media de las cinco notas que han obtenido. Las notas han sido:

Notas Media
Estudiante N°01: 14, 15, 15, 15, 16. 15
Estudiante N 02: 11, 12, 15, 18, 19. 15

Si observamos la media de los dos estudiantes tendrían la misma nota (15), lo que nos haría
pensar que los dos estudiantes son similares, pero si observamos sus notas hay una gran
diferencia entre ambos:

El estudiante N°01 tiene unas notas muy homogéneas, muy próximas a la media, mientras que
el estudiante N°02 tiene notas muy dispares.

Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos mida esa
variabilidad. Nos referimos a las medidas de dispersión.

65
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad
de los datos, si la distribución de los datos es más o menos homogénea y por tanto nos dan
una medida sobre la representatividad de los parámetros de centralización (moda, mediana o
media).

En otras palabras, las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de
manera resumida una característica de la variable estudiada. En este sentido, deben
acompañar a las medidas de tendencia central. Juntas ofrecen información de un sólo vistazo
que luego podremos utilizar para comparar y, si fuera preciso, tomar decisiones.

Podemos decir finalmente que las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución; las medidas de dispersión nos permiten tener la
posibilidad de establecer comparaciones de diferentes muestras.

Las medidas de dispersión se dividen en dos grandes grupos:

A. Las medidas de Dispersión Absolutas

Estas medidas de dispersión vienen expresadas en la misma medida en que se expresa la


variable que genera la serie de datos y su valor se limita a la serie misma.

a. Rango, amplitud o recorrido.


b. Rango intercuartílico.
c. Desviación Media.
d. Desviación Estándar.
e. Varianza.
B. Las medidas de Dispersión Relativas

Estas medidas de dispersión son relaciones entre medidas de dispersión absoluta y medidas de
tendencia central, las cuales vienen expresadas en valores proporcionales o porcentuales y
tienen como función determinar entre varias distribuciones la de mayor o menor dispersión; es
decir, Heterogeneidad u homogeneidad entre dos series de datos.

a. Coeficiente de Variación.

A. Medidas de Dispersión Absolutas


a. RANGO
Se denomina rango a la diferencia entre el mayor y el menor valor de un conjunto de los
datos de una distribución estadística. Se calcula por medio de la fórmula:

Rang(X) = Máx(X) - Mín(x)


Dónde:

Max (X): Es el máximo valor que toma la variable X en los datos recogidos.

Mín (x ):Es el mínimo valor que toma la variable X en los datos recogidos.

66
Características:

 Solo suministra información de los extremos de las variables.


 Informa sobre la distancia entre el mínimo y máximo valor observado.
 Se limita su uso a una información inicial.
Utilidad:

 El rango representa la amplitud de la variación de un fenómeno entre su límite menor y


uno claramente mayor.
 Expresa cuantas unidades de diferencia podemos esperar, como máximo, entre dos
valores de la variable.
 Estima el campo de variación de la variable.
 Conserva datos y se puede calcular a partir de restar el valor máximo con el mínimo.
Desventaja:

 No expresa realmente la concentración de los datos, presentándose casos en los cuales se


obtienen intervalos exagerados cuando en realidad la serie tiene una gran concentración,
pero sus valores extremos difieren mucho del resto de valores de la serie.
Ejemplo 01
Se tiene la edad de un grupo de personas, las cuales son las siguientes:

17, 18, 18, 18, 23, 15, 25, 18, 20, 17, 35.

El Rango será igual a:

Rang(x )=Máx(x )– Mín( x)


Rango = 35 – 15

Rango = 20

El cual es exagerado y no da una idea real de la concentración de los datos.

Ejemplo 02

En una empresa se quiere analizar estadísticamente las ventas conseguidas de su producto


estrella durante los últimos veinte años. Para ello, le solicitan calcular varias métricas
estadísticas entre ellas el rango. Si las ventas del producto son las mostradas en la siguiente
tabla, ¿Cuál es el rango de este conjunto de datos?

67
AÑOS VENTAS
1 4239
2 6674
3 7714
4 4121
5 9391
6 6648
7 9048
8 5717
9 3623
10 3433
11 3156
12 8686
13 3805
14 6828
15 1895
16 7468
17 9947
18 8941
19 8065
20 8680

En este ejercicio tenemos 20 observaciones. En realidad, el número total de observaciones es


indiferente para sacar el rango de una muestra, porque solo nos interesa el valor más grande y
el valor más pequeño.

El Rango será igual a:


Rang(x )=Máx(x )– Mín( x)
R=9947−1895=8052

Por consiguiente, se determina que la variación máxima que se ha producido de la venta


durante estos últimos años es de 8052 unidades.
Representando gráficamente todos los datos del ejercicio junto con su rango estadístico:

68
b. RANGO INTERCUARTÍLICO
El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de la dispersión
de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango
intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es
la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos).

Se calcula por medio de la fórmula:

IQR = Q3 – Q1
Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución normal o
campana de Gauss) es más apropiado medir la tendencia central y la dispersión mediante la
mediana y el rango intercuartil respectivamente que con la media aritmética y la desviación
típica.

Ejemplo 01
Para el cálculo de un rango intercuartílico, consideraremos el conjunto de datos:

2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9

Q1 = (3 +4)/2 Q3 = (8 +8)/2
M
Mínimo =2

Q1 = 3,5

Mediana =6

Q3 =8

Máximo =9

Así vemos que el rango intercuartil es:

IQR = Q3 – Q1

IQR = 8 – 3,5

 IQR = 4,5.

69
Ejemplo 02

Hallar el rango intercuartil de la siguiente muestra que está constituida por las edades de 15
personas detenidas en esta última semana, en la Comisaría Sol de Oro:

25 17 19 28 26

27 20 18 26 12

18 28 16 30 22

1° Debemos de ordenar de mayor a menor:

12 16 17 18 18

19 20 22 25 26

26 27 28 28 30

2° Debemos de determinar el Q1 y Q3:

Q1 = Percentil 25

25
i=( )(15)
100

i = (0 . 25)(15)

i = 3.75 => 4

 Q1 se encuentra en la Posición 4

Q1= 18

Q3 = Percentil 75

75
i=( )(15)
100

i = (0.75)(15)

i = 11.25 => 12

 Q3 se encuentra en la Posición 12

Q3= 27

70
Por lo tanto:

IQR = Q3 – Q1

IQR = 27 – 18

IQR = 9

c. DESVIACIÓN MEDIA

Es el valor promedio de los desvíos tomados en valor absoluto, de los datos con respecto a un
término central. El término central en la práctica es la media aritmética, pero también puede
usarse la mediana, la moda o un valor arbitrario, dependiendo de los datos estudiados. Para el
cálculo de la desviación media se utilizará las siguientes fórmulas:
N

∑ ¿ X i−X ∨¿ Datos no agrupados.


DM = i =1 ¿
N
k

∑|X i− X|f i Datos agrupados


DM = i =1
N

Características:

Todas las observaciones se usan en el cálculo.


No tiene la influencia debido a los valores altos y bajos.
Es un poco difícil trabajar con los valores absolutos.
Ventajas

 La desviación media se puede utilizar como medida de dispersión en todas aquellas


distribuciones en las que la medida de tendencia central más significativa haya sido la
media.
 Utiliza en su cálculo todos los valores de la muestra.
 Fácil de comprender pues es el promedio en que los valores se desvían con respecto a la
media.

Desventajas

 La desviación media de una muestra no es un buen estimador de la desviación media de la


población, que finalmente es lo que nos interesa conocer.

Ejercicio 01

Calcular la desviación media de los siguientes datos: 2, 4, 6 y 8.

71
Empezamos calculando la media aritmética de los datos, teniendo en cuenta que tenemos 4
datos (n = 4)

El valor de la media aritmética es de 5.

Ahora aplicamos la fórmula de la desviación media:

El valor de la desviación media es 2.

Ejercicio 02

A continuación, se muestra un cuadro de calificaciones correspondientes a una sección del


curso de estadística de la EESTP-PNP-San Bartolo; Calcular la Desviación Media.

Intervalo fi Xi fi*Xi | Xi− X| | Xi− X|fi


0 - 5 1 2.5 2.5 8.7 8.7
5 - 8 8 6.5 52.0 4.7 37.6
8 - 10 10 9.0 90.0 2.2 22.0
10 - 12 20 11.0 220.0 0.2 4.0
12 - 15 15 13.5 202.5 2.3 34.5
15 - 20 6 17.5 105.0 6.3 37.8
60 672.0 144.6

Cálculo de la Media:

672
X= =11.2
60

Cálculo de la Desviación Media:


k

∑|X i− X|f i
DM = i =1
N

144.6
DM = =2.41
60

EJERCICIOS PROPUESTOS

Ejercicio 01

72
Se tiene los años de servicio en la PNP de los servidores administrativos; 2, 2, 4, 4,4, 5, 6, 7, 8,
8. Calcular la desviación media de estos valores.

X x−x |x−x|
2

CÁLCULO DE LA MEDIA ARITMÉTICA

x=
CÁLCULO DE LA DESVIACIÓN MEDIA

DM =

Ejercicio 02

Hallar la desviación media de la siguiente tabla referida a las edades de los miembros de la PNP
en el departamento de ICA

Clase fi

16-20 2

20-24 8

24-28 8

28-32 18

32-36 20

73
36-40 18

40-44 15

44-48 8

48-52 3

Completar la siguiente tabla

Clase fi xm fi  xm
|x−x| fi  |x−x|

16 - 20 2

20 - 24 8

24 - 28 8

28 - 32 18

32 - 36 20

36 - 40 18

40 - 44 15

44 - 48 8

48 - 52 3

CÁLCULO DE LA MEDIA ARITMÉTICA

x=
CÁLCULO DE LA DEVIACIÓN MEDIA

DM =

Ejercicio 03

74
Según cuadro; a los trabajadores de la PNP de la Ciudad de Satipo, le asignaron viáticos por
trabajo de campo en los pueblos cercanos, en el mes de julio del 2011.

[ Li Ls ⟩ Xi fi Xi.fi |x−x| fi  |x−x|


420 - 440 10

440 - 460 8

460 - 480 11

480 - 500 10

500 - 520 16

520 - 540 39

540 - 560 40

560 - 580 23

580 - 600 13

600 - 620 9

620 - 640 1

TOTAL
Calcular:

Media=

DESVIACION MEDIA =

Ejercicio 04

Los resultados siguientes representan las calificaciones del examen final del curso de
análisis estadístico en la PNP.

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 95 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

HALLAR:

a) TABLA DE DISTRIBUCIÓN DE FRECUENCIA

75
b) DESVIACIÓN MEDIA

76
SESIÓN 10
DESVIACIÓN ESTÁNDAR, VARIANZA COEFICIENTE DE VARIACIÓN

d. DESVIACIÓN ESTÁNDAR

Es una medida de dispersión para variables con razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

En otras palabras, es una medida del grado de dispersión de los datos respecto al valor
promedio. La Desviación Estándar es simplemente el “promedio” o variación esperada con
respecto a la media aritmética. Para el cálculo de la desviación estándar se utilizará la siguiente
fórmula:

Características:

 Es el parámetro de dispersión más utilizado.


 Es afectada por el valor de cada observación.
 Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las
desviaciones extremas que en las demás desviaciones.
 Al construir la tabla de frecuencia de una variable discreta y calcular a partir de ella la
desviación estándar, no hay pérdida de información por lo que la desviación para los
datos observados es igual que para los datos tabulados.

Utilidad:

Su utilidad radica en la transmisión de cuánto tienden a alejarse los valores concretos del
promedio en una distribución. De hecho, específicamente, el cuadrado de la desviación
estándar es “el promedio del cuadrado de la distancia de cada punto respecto del promedio”.
Se suele representar por una S o con la letra sigma.

Ejemplo:

Calcular la desviación estándar de las siguientes calificaciones de un estudiante de


Estadística en el último periodo académico:

Calificaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética (ẋ):


Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6  120 / 6 = 20

Calculamos la Desviación Estándar:

σ2 = *(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] / 6

σ2 = 16 / 6  2,67

77
Desviación estándar: σ = √ 2,67  1,63

e. VARIANZA

La noción de varianza se suele emplear en el ámbito de la estadística. Se trata de una


palabra impulsada por el matemático y científico inglés Ronald Fisher (1890-1962) y sirve
para identificar a la media de las desviaciones cuadráticas de una Variable de carácter
Aleatorio, considerando el valor medio de ésta.

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de


una distribución estadística. Para el cálculo de la varianza se utilizarán las siguientes
fórmulas:

Varianza poblacional:

[ ]
N N N
1
1
σ = ∑ (x i−μ)2
2
N i=1
=
N
∑ x i −N μ = N1 ∑ x i2−μ 2
2 2

i=1 i =1

Varianza muestral:

[ ]
n n
1 1 1
S2 = ∑ ( x −x)2
n−1 i=1 i
=
n−1
∑ x 2i −n ( x )2 =
n−1
¿
i=1

Característica:

 Es siempre un valor no negativo, que puede ser igual o distinta de 0.


 La varianza es la media de dispersión cuadrática óptima por ser la menor de todas.
 Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
 Si todos los valores de la variable se multiplican por una constante la varianza queda
multiplicada por el cuadrado de dicha constante.

Utilidad:

 Se utiliza para identificar a la medida de las desviaciones cuadráticas de una variable de


carácter aleatorio, considerando el valor medio de esta.
 Esta medida es sensible a cada uno de los datos de la serie.
 La varianza revela aspectos en la dispersión que no refleja el rango.
 Cuanto mayor sea la varianza, más dispersos se encontrarán los datos con respecto a su
media aritmética y puede recurrirse a la mediana como dato representativo de la
distribución.

Ejemplo

Hallar la desviación media, la varianza y la desviación típica de las series de números


siguientes: 2, 3, 6, 8, 11.

78
Para la serie de números x 1=2, x2=3, x3=6, x4=8, x5=11 con n=5=N tenemos los siguientes
cálculos.

Para la desviación media primero necesitamos calcular el valor de la media, luego la


desviación media, la varianza y por último la desviación estándar.

Media:

Desviación media:

Varianza:

Desviación estándar:

Datos no agrupados:

A la media aritmética de los cuadrados de las desviaciones se le llama varianza, se denota por
σ2 y se calcula: Varianza poblacional = Suma de los cuadrados de las desviaciones / Número de
datos
Para datos no agrupados utilizaremos la fórmula antes definida:

2 1
S= ¿
n−1

Ejercicio 01

Asumamos que las utilidades netas (en millones de soles) correspondientes a 40 empresas
elegidas al azar fueron las siguientes:

3.5 4.6 8.8 3.4 -2.3 6.1 -4.6 2.6 3.8 12.6
2.1 4.1 3.2 -4.2 2.4 -6.8 5.0 -3.3 -2.2 2.4
3.7 1.8 3.6 -4.5 2.9 3.3 -0.4 4.2 -0.8 -2.5
3.1 9.1 2.6 4.3 -0.9 2.1 1.6 8.1 5.6 10.7

79
Determinando el Rango: R = X máx – X min

R = 12.6 – (-6.8) = 19.4 millones.

Para calcular la varianza muestral, primero obtendremos la suma de las observaciones y la


suma de los cuadrados de las observaciones.
40

∑ x i=3.5+ 4.6+ 8.8+…+(−4.2 )=98.8 millones de soles .


i=1

40

∑ x i2=(3.5)2+(4.6)2 +(8.8)2+ …+(−4.2 )2=944.66(millones de soles)2 .


i=1

Aplicando la fórmula tendremos:

1 2
¿S=
n−1

[ ]
2
2 1 98.8
S= 944.66− =17.96
40−1 40

Datos agrupados:

La varianza de una serie de datos agrupados se calcula de la siguiente forma:


Varianza poblacional = Suma de los productos (f * (Pm - μ)2) / Número de datos

Es decir, σ2 = Ʃ f*(Pm ‒ μ)2 / n


Donde n es el número total de datos,

Σ es el símbolo de sumatoria,

f es la frecuencia de cada clase,

Pm es el punto medio de cada clase y

μ es la media aritmética de la serie de datos.

Cuanto mayor sea la varianza, más dispersos se encontrarán los datos con respecto a su
media aritmética.

Ejercicio 01

En la tabla aparecen los datos correspondientes a la cantidad de cuadernos vendidos por


Carlos durante 30 días; además, se han calculado las diferencias Pm ‒ μ, los cuadrados
(Pm ‒ μ)2 y los productos fC (Pm ‒ μ)2 como se muestra en las últimas tres columnas:

Cantidad de Número de Punto medio Pm ‒ μ (Pm ‒ μ)2 fC (Pm ‒ μ)2

80
cuadernos días (fc) (Pm)
vendidos
5 a 10 3 7.5 7.5 ‒ 17.5 = ‒10 (‒10) 2 = 100 3(100) = 300
10 a 15 7 12.5 ‒5 25 175
15 a 20 10 17.5 0 0 0
20 a 25 8 22.5 5 25 200
25 a 30 1 27.5 10 100 100
30 a 35 1 32.5 15 225 225
Total 30 1000

Media aritmética (μ) = 17.5

1000
Varianza= =33.33
30

EJERCICIO PROPUESTO

Ejercicio 01

Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a
una comisaría, encontrando:

Policías 0 1 2 3 4 5 6 7 8
Frecuencias 5 19 29 30 22 16 14 9 6

a) Determinar la media, desviación estándar y varianza.

B. MEDIDAS DE DISPERSIÓN RELATIVAS

a. COEFICIENTE DE VARIACIÓN

La medida de dispersión relativa de mayor importancia es el Coeficiente de Variación, que se


expresa en porcentaje y se define como el cociente entre la desviación estándar y la media
aritmética de una distribución o de un conjunto de observaciones.

Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando


una mejor interpretación porcentual del grado de variabilidad que la desviación estándar.

σ
Coeficiente de Variabilidad poblacional: CV = (100 %)
μ

S
Coeficiente de Variabilidad muestral: CV = (100 %)
X

Características:

 Se calcula como cociente entre la desviación estándar y la media. Es un porcentaje que


permite comparar el nivel de dispersión de dos muestras.
 Puesto que tanto la desviación estándar como la media se miden en las unidades originales,
el coeficiente de variación es una medida independiente de las unidades de medición.

81
 El coeficiente de variación no se puede definir si la media es igual o próximo a cero.
 Si la media es un valor negativo, debe considerarse su valor absoluto para evaluar el
coeficiente de variación.
 El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas
distribuciones de probabilidad puede ser 1 o mayor que 1.
 Para su mejor interpretación se expresa como porcentaje.

Utilidad:

 El coeficiente de variación es muy usado para evaluar la precisión de un experimento,


comparando el coeficiente de variación del experimento en cuestión con los valores de este
en experiencias anteriores.
 Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de
unidades de medida. Por ejemplo, kilogramo y centímetros.
 Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas
distintas.
 Comparar dos grupos de datos que tienen distinta media.
Para la evaluación del valor del coeficiente de variación, cuando se trabaja con datos
económicos se puede utilizar la siguiente escala:

CV Grado de variabilidad
0 ≤ CV <10 Datos muy homogéneos
10 ≤CV <15 Datos regularmente homogéneos
15 ≤CV <20 Datos regularmente variables
20 ≤ CV <25 Datos variables
CV ≥ 25 Datos muy variables

Para comparar la variabilidad de dos o más conjuntos de observaciones, se debe tener en


cuenta lo siguiente:

 Si las unidades de medida de las observaciones de dos o más conjuntos de datos son las
mismas y sus promedios son iguales o semejantes, se debe utilizar la varianza o desviación
estándar.
 Si las unidades de medida de las observaciones de dos o más conjuntos de datos son
diferentes o si sus promedios son diferentes, se debe utilizar el coeficiente de variación.

Ejercicio 01

Una muestra de estudiantes de la EESTP-PNP, San Bartolo tiene una estatura media de 160 cm
con una desviación estándar de 16 cm. Estas mismas estudiantes, tienen un peso medio de 70
kg con una desviación estándar de 14 kg. ¿Cuál de las 2 variables presenta mayor variabilidad
relativa?

82
Estatura (E) Peso (P)

X E =160 cm. X P=70 kg .

s E=16 cm. s P=14 kg .

Cálculo del CVE Cálculo del CVP

sE sP
CV E = CV P =
XE XP

16 14
CV E = =0.1 CV P = =0.2
160 70

CV E =10 % CV P =20 %

Podemos observar que CVP > CVE, por lo tanto, llegamos a la conclusión, que el peso de esta
muestra de estudiantes tiene mayor variabilidad relativa que la estatura

Ejercicio 02

En la siguiente tabla se muestran los pesos en kilos de un grupo de 100 estudiantes de la


EESTP-PNP, San Bartolo. Se solicita calcular la Varianza y el Coeficiente de variabilidad.

Peso (kg.) fi
60 - 63 5
63 - 66 18
66 - 69 42
69 - 72 27
72 - 75 8
100
Paso 1: Completamos la tabla con la información requerida para calcular la varianza.

Peso 2
(kg.)
fi Xi Xi*fi Xi2 *fi ( X i−X ) f i
60 - 63 5 61.5 307.5 18911.25 208.0125
63 - 66 18 64.5 1161.0 74884.50 214.2450
66 - 69 42 67.5 2835.0 191362.50 8.5050
69 - 72 27 70.5 1903.5 134196.75 175.5675
72 - 75 8 73.5 588.0 43218.00 246.4200
100 6795.0 462573.00 852.7500

Cálculo de la media:

83
[ ]
n
1
X= ∑ X f =¿ 6795
n i=1 i i 100
=67.95 ¿

Paso 2: Utilizaremos la fórmula de la varianza para datos agrupados:

( )
n 2

[∑ ] ∑ xi f i
n n
1 1
s2= ∑ (x −x )2 f i = 2
xi f i −n x
2
= 1
n
n i=1 i n i=1 ∑ x2 f −
n i=1 i i
i=1
n

Reemplazando datos tendremos:

( )
n 2

1
n ∑ xi f i
s = ∑ xi f i−
2 2 i=1
n i=1 n

( )
2
2 1 ( 6795
s= 462573 )− =8.5275
100 100

Cálculo de la desviación estándar:

s= √ 8.5275=2.92

Cálculo del coeficiente de variación:

s
CV =
x

2.92
CV = =0.0430=4.3 %
67.95

Ejercicios propuestos

Ejercicio 01

Se efectúa un estudio para analizar los tiempos de espera en segundos, de los clientes de un
banco regional, para ello se registran dos situaciones: cuando hacen una fila única y cuando
hacen filas individuales ante las ventanillas de atención. Los resultados son los siguientes:

Fila única 390 396 402 408 426 438 444 462 462 462
Filas individuales 252 324 348 372 402 462 462 510 558 600

Compare ambos conjuntos de datos a través de su coeficiente de variación respectivo:

Ejercicio 02

Una encuesta realizada a una muestra de alumnos de la EESTP-San Bartolo para conocer el
número de horas que navegan semanalmente en internet, arrojó los datos de la tabla. Calcular
el coeficiente de variación.

84
Frecue
Horas ncia
fi
[ 0 - 10) 2
[10 - 20) 3
[20 - 30) 3
[30 - 40) 7
[40 - 50] 5
EJERCICIOS PROPUESTOS

Ejercicio 01

En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas


edades y cantidades se especifican en el siguiente cuadro:

EDADES FRECUEN
CIA
[ 20; 25 > 2
[ 25; 30 > 5
[ 30; 35 > 2
[ 35; 40 ] 1

a) Hallar la varianza y la desviación estándar.

Ejercicio 02

En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan
anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos:

INTERVALOS FRECUENCIA
[ 20; 40 > 10
[ 40; 60 > 30
[ 60; 80 > 20
[ 80; 100 > 20
[ 100; 120 ] 20

Ejercicio 03

Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 estudiantes de la escuela


de San Bartolo.

Cantidad de Libros Leídos


0 3 0 1 0 1 1
1 2 1 1 4 2 3
3 2 2 1 1 2 1

85
a) Calcular las medidas de dispersión.

Ejercicio 04

Los siguientes datos representan el peso de 4 brigadieres de la escuela de San Bartolo


expresados en Kilogramos: 64; 70; 66 y 80.

a) Calcular la media, varianza, la desviación estándar y el coeficiente de variación.

Ejercicio 05

Calcular la varianza y la desviación estándar de la siguiente distribución de frecuencias:

Intervalo 0a 10 a 20 a 30 a 40 a 50 a 60 a
10 20 30 40 50 60 70
Frecuenci 8 34 76 60 31 28 13
a

Ejercicio 06

Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a
una comisaría, encontrando:

Policías 0 1 2 3 4 5 6 7 8
Frecuencia 5 19 29 30 22 16 14 9 6
s

a) Determinar la media, desviación estándar y varianza.

Ejercicio 07

La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de estudiantes:

Estatura 60 a 63 a 66 a 69 a 72 a
62 65 68 71 74
Frecuencia 5 18 42 27 8

a) Determine el rango, la media de las desviaciones absolutas, la desviación


estándar, varianza y el coeficiente de variación.

Ejercicio 08

Dada la siguiente tabla de frecuencias, para datos sin agrupar:

Valor 0 1 2 3 4 5 6 7

86
Frecuencia 8 14 25 13 20 12 6 2

a) Calcule su varianza, la desviación estándar, el rango, la media de las desviaciones


absolutas.

SOLUCION DE MEDIDAS DE DISPERSION

GUÍA DE RESPUESTAS
1.-En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y
cantidades se especifican en el siguiente cuadro:
SOLUCION
SOLUCION DE MEDIDAS
DE MEDIDAS DE DISPERSION
DE DISPERSION
Ejercicio
Hallar la N° 01:y la desviación típica.
varianza

1.-En
1.-En una una redada
redada en el distrito
en el distrito de Chorrillos
de Chorrillos se se logró
logró capturar avezados
capturar avezados delincuentes
delincuentescuyas edades
cuyas y
edades y
cantidades
cantidades se especifican
se especifican en elen
Frecuencia el siguiente
siguiente Marcacuadro:
cuadro:de Frecuencia _ _ _
Edades fi*Xi Xi  X ( X i  X ) 2 ( X i  X )2 * fi
Hallar laHallar la varianza
varianza
fi típica.
y la desviación
y la desviación
clase
típica. Xi Acumulada
[20 - 25> 2 22.5 45.00 2 -6 36 72
[25 - 30> 5 27.5 137.50 7 -1 1 5
[30 - 35> 2 32.5 65.00 9 _
X iXi X4_
 X ( X i( X X
_
) 216( X2  X
_ _
) 2 *f iX 32
_

i  X ) i (X i )2 * fi
[35[20
- 40] [20 - 25>
- 25> 12 2 37.5
22.5
22.5 37.50
45.00
45.00 210
2 -6 -69 36 36 81 72 7281
[25 - [25 - 30>
30> 105 5 27.5
27.5 285.00
137.50
137.50 77 -1 -1 1 1 5 5190
[30 - [30 - 35>
35> 2 2 32.5
32.5 65.00
65.00 99 4 4 16 16 32 32
[35 - [35 - 40]
40] 1 1 37.5
37.5 37.50
37.50 10
10 9 9 81 81 81 81
Media = 28.5
10 10 285.00
285.00 190 190

MediaMedia
= = 28.5
28.5
Varianza = 19
Varianza
Varianza = = 1919
Desviación típica = 4.36
Desviación
Desviación típicatípica
= = 4.36
4.36

2.- En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el
Ejercicio
2.- En N°
campo.
campo.
un
Halla 02:
2.-estudio
En un estudio
laslas
campo.
Halla Halla
medidas
estadístico
estadístico
medidas dede
se analizó
se analizó
dispersión,
las medidas
dispersión,
la cantidad
la cantidad
según
de dispersión,
según los
según
dedebalas
balasque
siguientes
loslos
que los
los efectivos
siguientesdatos
siguientes
efectivospoliciales
enel
datos en
datos en
policiales
elcuadro
el cuadro
cuadro dado.
dado.
dado.
utilizan anualmente
utilizan en el en el
anualmente

Frecuencia Marca de Frecuencia _


_
_
_
_
_ _

fi*Xi X iX X _ ( X i( 
XX ) 2 ( X_2i  X ) 2 * f i | 2X_  X | * fi _

i  X
INTERVALOS
i  X )
(X i  X ) * fi
i
| X i  X | *_ f i
fi clase Xi Acumulada
Xi  X (X i  X )2 ( X i  X ) * fi
2 | X i  X | * fi
[ 20; 40 > 10 30 300 10 -42 1764 17640 420
[ 40; 60 > 30 50 1500 40 -22 484 14520 660
[ 60; 80 > 20 70 1400 60 -2 4 80 40
[ 80; 100 > 20 90 1800 80 18 324 6480 360
[ 100; 120 ] 20 110 2200 100 38 1444 28880 760
100 7200 67600 2240
100 7200 67600 2240

Media = 100 72 7200 67600 2240


Media = 72

Varianza = 676
Varianza = 676
Media =Desviación típica = 72
26.00
Desviación típica = 26.00

Media
Varianza = lasdedesviaciones
las desviaciones medias = 22.40
Media de medias 676
= 22.40

3.- Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
Desviación
3.- Se reporta típica
la cantidad de =
libros leídos en un
0 3 0 1 0 1
26.00
mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
0 3 0 1 0 1
1 1 2 1 1
1 1 2 1 1
Media de las 4 2 3 3 medias 2
4 desviaciones
2 3 3 2 = 22.40
Ejercicio N° 03: 2 1
2 1 1 2 1
1 2 1
Calcula las medidas de dispersión.
3.- Calcula
Se reporta la cantidad
las medidas de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
de dispersión.
0 3 0 1 0 1
Frecuencia
#1de Libros
1 2 Frecuencia
1 1 _ _ _
Xi fi*Xi X i  X _ ( X i  X ) 2 (_X2i  X ) 2 * f i _| 2X  X | | X* f
_

fi Acumulada Xi  X
i i
 X
_

4 2 3 3 2 (X i  X ) ( X i  X ) * fi i | * fi

0 3 0 0 3 -1.52 2.3220 6.9660 4.57


2 1 1 2 1
1 9 1 9 12 -0.52 0.2744 2.4694 4.71
2 5 2 10 17 0.48 0.2268 1.1338 2.38
Calcula las medidas de dispersión.
3 3 3 9 20 1.48 2.1791 6.5374 4.43
4 1 4 4 21 2.48 6.1315 6.1315 2.48
21 32 23.2381 18.57
21 32 _ _ 23.2381
_ 18.57 _
Xi  X (X i  X )2 ( X i  X )2 * fi | X i  X | * fi

Media = 1.52
Media = 1.52
Varianza = 1.1066
Varianza = 1.1066
Desviación típica = 1.05
Desviación típica = 1.05
Media de las desviaciones medias = 0.88435
Media de las desviaciones
21 medias = 0.88435
4.- Los siguientes datos representan 32
el peso de 4 capitanes 23.2381
de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. 18.57
4.- Los siguientes datos representan
Calcular la varianza eltípica.
y la desviación peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80 .
Calcular la varianza y la desviación típica.
Ejercicio N° 04: _ _ _
Media = 1.52 X i  X _ ( X i  X ) 2 (_X2i  X ) 2 * f i _ 2
Xi  X (X i  X ) ( X i  X ) * fi

Varianza = 1.1066

Desviación típica = 1.05


4
87
280 152
4 280 152
Media de las desviaciones medias = 0.88435
Media = 70
4.- Los siguientes datos
Media = representan el peso de 4 capitanes
70 de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80.
Calcular la varianza yVarianza
la desviación
=
típica. 38
Varianza = 38
Desviación típica = 6.16 _ _ _
Desviación típica = 6.16 Xi  X (X i  X )2 ( X i  X )2 * fi
Desviación típica = 1.05
Varianza = =
Media 1.1066 1.52
Media de las desviaciones medias = 0.88435
Varianza = 1.1066
Desviación
4.- Los siguientes datos típica = el peso de 4 capitanes
representan 1.05 de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80.
Calcular la varianza y la desviación
Desviacióntípica.
típica = 1.05
Media de las desviaciones medias = 0.88435
Media de las desviaciones medias = 0.88435
4.- Los 4.-
siguientes datos representan
Los siguientes el pesoel
datos representan depeso
4 capitanes de la escuela
de 4 capitanes de oficiales
de la escuela expresados
de oficiales
_ en Kilogramos:
expresados
_ 64; 70; 64;
en Kilogramos: 66_ y270;
80.66 y 80.
CalcularCalcular
la varianza y la desviación
la varianza típica. típica.
y la desviación Xi  X ( X i  X ) 2 ( X i  X ) * fi

Frecuencia Peso Frecuencia _ _ _


Capitan fi*Xi _X  X ( X_  X )2 _( X  X )2* fi
fi Xi Acumulada
Xi  X
i
( X i  X )2 * fi
i
(X i  X )2
i

A 1 64 64 1 -6 36 36
B 1 70 70 2 0 0 0
C 1 66 66 3 -4 16 16
D 4 1 80
280 80 4 10 100 100
152
4 280 152

4 280 152
Media = 70
Media = 70
Varianza = 38
Varianza = =
Media 3870
Desviación típica = 6.16

Varianza
Desviación = =
típica 6.1638
5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:
Desviación típica = 6.16

Ejercicio N° la05:
5.- Calcular varianza y la desviación típica de la siguiente distribución de frecuencias:
X i  X
_
(X i  X )2
_
( X i  X )2* fi
_

5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:

Frecuencia Marca de Frecuencia _ _ _


INTERVALOS fi*Xi Xi  X (X  X )2 ( X i  X )2* fi
fi clase Xi Acumulada _
i
_ _

[ 0; 10 > 8 5 40 8
Xi  X
-28.32
( X i  X ) 2 ( X i  X )2 * fi
802.02 6416.18
[ 10; 20 > 34 250
15 510 8330
42 -18.32 335.62 11411.16
53694.40
[ 20; 30 > 76 25 1900 118 -8.32 69.22 5260.90
[ 30; 40 > Media60
= 35 2100
33.32 178 1.68 2.82 169.34
[ 40; 50 > 31 45 1395 209 11.68 136.42 4229.09
Varianza = 214.78
[ 50; 60 > 28 55 1540 237 21.68 470.02 13160.63
[ 60; 70 ] 13 típica =
Desviación 65 845
14.66 250 31.68 1003.62 13047.09
250 8330 53694.40
250 8330 53694.40

6.- Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
Determine la varianza, la desviación típica y la media de las desviaciones medias.
Media =Media = 33.32
33.32

Varianza =
Varianza = 214.78
214.78 Xi  X
_
(X  X )2
_
( X i  X )2* fi
_

| X  X
_
| * fi
i i

Desviación
Desviación típica típica
= = 14.66
14.66

6.- Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
Ejercicio N°
6.- Durante 06:periodo
un
Determine
de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
la varianza, la desviación típica y la media de las desviaciones medias.
Determine la varianza, la desviación típica y la media de las desviaciones medias.
150 530 4.20 613.33 252.53

Frecuencia Frecuencia _ _ _
Policias
Media = Xi fi*Xi
3.53 Xi  X (X i  X )2 ( X_ i  X ) 2 * f i
_
fi Acumulada _ | _X i  X | * fi
X X ( X i  X )2* fi
_

i (X  X )2 | X  X | * fi
0Varianza = 5 0 4.090 5 -3.53 12.48i 62.42 17.67 i

1 19 1 19 24 -2.53 6.42 121.94 48.13


Desviación típica = 2.02
2 29 2 58 53 -1.53 2.35 68.18 44.47
3Media de las
30desviaciones
3 medias = 90 83
1.68356 -0.53 0.28 8.53 16.00
4 22 4 88 105 0.47 0.22 4.79 10.27
5 16 5 80 121 1.47 2.15 34.42 23.47
6 14 6 84 135 2.47 6.08 85.18 34.53
7.- La siguiente
7 tabla se refiere
9 a las estaturas
7 en pulgadas,
63 de un grupo de alumnos:
144 3.47 12.02 108.16 31.20
8 6 8 48 150 4.47
Determine el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.
19.95 119.71 26.80
150 530 4.20 613.33 252.53

150 530 4.20 _ _


613.33
_
252.53
_

Xi  X (X i  X )2 ( X i  X )2* fi | X i  X
|* f i

Media = 3.53

Media =Varianza = 3.53


4.09

Desviación
Varianza = típica = 2.02
4.09
100 6745 852.75 226.50

Media
Desviación de las=desviaciones medias
típica 2.02= 1.68356
Media = 67.45
Media de las desviaciones medias = 1.68356
Varianza = 8.53

Ejercicio N° 07: Desviación típica = 2.92


7.- La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de alumnos:
Media de las desviaciones absolutas = 2.27
Determine el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.
7.- La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de alumnos:
8.- Dada la siguiente tabla de frecuencias, para datos sin agrupar:
Determine el rango, lasu
Calcule media de las
varianza, desviaciones
la desviación típica,absolutas,
el rango, la la varianza
media de las y la desviación
desviaciones _ típica.
absolutas. _ _ _

Xi  X (X i  X )2 ( X i  X )2 * fi | X i  X | * fi

_ _ _ _

X i _ X (X  X_ ) 2 ( X i  X )_2 * f i | X i  X | *_ f i

Xi  X ( X i  X )2* fi
i
(X i  X )2 | X i  X | * fi

100 6745 852.75 226.50

100 293 306.51 147.42


Media = 100 67.45 6745 852.75 226.50

Varianza = 8.53 88
Media = 2.93

Media =Desviación típica= =


Varianza 2.92
67.45 3.07

Media de Desviación
las desviaciones típica =
absolutas = 2.27 1.75
Varianza = 8.53
Media de las desviaciones absolutas = 1.47
Media = 3.53

Varianza = 4.09
7.- La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de alumnos:
Desviación típica = 2.02
Determine el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.
Media de las desviaciones medias = 1.68356

Intervalos de Frecuencia Marca de Frecuencia _ _ _


fi*Xi Xi  X ( X i  X ) 2 ( X i  X )2 * fi | X
_
 X | * fi
Estatura fi clase Xi Acumulada i

[ 60;se
7.- La siguiente tabla 62refiere
] a las5 estaturas en
61 pulgadas,305
de un grupo5de alumnos:-6.45 41.60 208.01 32.25
[ 63; 65 ] 18 64 1152 23 -3.45 11.90 214.25 62.10
Determine el rango, la media de las
[ 66; 68 ] 42
desviaciones
67
absolutas,
2814
la varianza65
y la desviación
-0.45
típica. 0.20 8.51 18.90
[ 69; 71 ] 27 70 1890 92 2.55 6.50 175.57 68.85
[ 72; 74 ] 8 73 584 100 5.55 30.80 _
246.42 44.40
_ _ _

100 6745 Xi  X (X i
( X i  X ) 2 * f226.50
 X ) 2 852.75 i
| X i  X | * fi

Rango = 14

Media = 67.45

Varianza = 100 8.53 6745 852.75 226.50

Desviación típica = 2.92

Media
Media de =
las desviaciones absolutas = 67.45
2.27

Varianza = 8.53

Desviación típica = 2.92


8.- Dada la siguiente tabla de frecuencias, para datos sin agrupar:
Media de las desviaciones absolutas = 2.27
Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.

Ejercicio
8.- DadaN° 08: tabla de frecuencias, para datos sin agrupar:
la siguiente
X X
_ _ _
( X i  X ) 2 ( X i  X )2 * fi | X i
_
 X | * fi
Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.
i

Frecuencia Frecuencia _ _ _
Valor Xi fi*Xi Xi  X (X  X )2 ( X i  X )2 * fi | X
_
 X | * fi
fi Acumulada i
i

0 8 0 0 8 -2.93 8.58 68.68 23.44


1 14 1 14 22 -1.93 3.72 52.15 27.02
2 25 2 50 47 -0.93 0.86 21.62 23.25
3 13 3 39 60 0.07 0.00 0.06 0.91
4 20 4 80 80 1.07 1.14 22.90 21.40
100 293 306.51 147.42
5 12 5 60 92 2.07 4.28 51.42 24.84
6 6 6 36 98 3.07 9.42 56.55 18.42
7 2 7 14 100 4.07 16.56 33.13 8.14
100 293 306.51 147.42
Media = 2.93
Rango = 7
Varianza = 3.07
Media = 2.93
Desviación típica = 1.75
Varianza = 3.07
Media de las desviaciones absolutas = 1.47
Desviación típica = 1.75

Media de las desviaciones absolutas = 1.47

SESIÓN 11
PRACTICAS DIRIGIDAS – REPASO

SESIÓN 12

SEGUNDA EVALUACIÓN PARCIAL

89
SESIÓN 13

 SUSTENTACION DE TRABAJOS COLABORATIVOS

SESIÓN 14

UNIDAD IV
PROBABILIDADES

INTRODUCCIÒN

La teoría de probabilidad es un modelo matemático no determinístico que analiza


fundamentalmente fenómenos que no se ciñen a una regla uniforme. El estudio de
probabilidades nos permite hacer observaciones de situaciones de las cuales no
estamos absolutamente seguros de lo que va a suceder, pero expresan ciertas
características de predicción.

EXPERIMENTO ALEATORIO (ε)

Se denomina experimento aleatorio a toda prueba o ensayo cuyos resultados no


son predecibles sin haberse realizado previamente la prueba.

Ejemplo:

 Arrojar un dado una vez


 Lanzar una moneda dos veces
 Tomar dos naipes de un mazo de 52 naipes

ESPACIO MUESTRAL ( ).

Es el conjunto de elementos de todos los resultados posibles de un experimento

aleatorio. Ejemplos:

1. ¿Cuál será el espacio muestral de un experimento de lanzar un dado?

90
1= {1;2;3;4;5;6} entonces 𝑛() = 6

2. ¿Cuál será el espacio muestral de un experimento de lanzar una moneda dos veces?

2 = {(c,c); (c,s); (s,c); (s,s)}

EVENTOS O SUCESOS:

Es un hecho que puede ocurrir o no si consideramos al espacio muestral como un


conjunto, el suceso sería un subconjunto de espacio muestral. Se denota
generalmente por las letras mayúsculas del alfabeto ( A,B,C,……)

Ejemplo

Al lanzar un dado, cuyo resultado obtenido sea mayor que 3.

 = 1;2;3;4;5;6 entonces 𝑛( ) =6 A = 4;5;6 entonces 𝑛( A) = 3

Observación

Podemos expresar las posibilidades de que ocurra un suceso usando un número comprendido
entre 0 y 1. En esta escala, el 0 representa un suceso imposible y 1 representa un suceso que
ocurrirá, con certeza. Podemos escribir P(A) para representar la probabilidad de que ocurra un
suceso A.

0≤ 𝑃(𝐴) ≤ 1

LA PROBABILIDAD DE UN SUCESO

según Laplace es la razón entre el número de casos favorables y el número total de casos
posibles.

𝑃(𝐴) = n(A)
n(𝑈)
Donde (𝐴):número de casos favorables

(𝑈): número total de casos posibles Propiedad : 0≤ 𝑃(𝐴) ≤ 1

𝑃(𝐴𝑐) = 1 − 𝑃(𝐴)

Observación

Si la probabilidad de un suceso es 𝑃, 𝑒𝑛 "𝑛" experimentos se espera que el suceso ocurra

𝑛𝑥𝑃 veces

Ejemplo 1:

91
Se arroja un dado equilibrado con 20 caras numeradas del 1 al 20. El suceso A se define como
“el número obtenido es un múltiplo de 4”.

a. Determine P(A). El dado se arroja 100 veces.


b. ¿Cuántas veces espera obtener un múltiplo de 4?
Solución

a) (𝐴) = 5 𝑦 𝑛(𝑈) = 20

𝑃(𝐴) = n(A) = 5 = 1

𝑛(𝑈) 20 4
b) 1 𝑥100 = 25
4
4

Ejemplo 2.

Encontrar la probabilidad que al lanzar un dado se obtiene un valor par.

Solución

= 𝑛(𝑈) == 1;2;3;4;5;6

𝑛(A) = 3

𝑛(𝑈) = 6

P(A) = 3 = 1 = 50%
6 2

Ejemplo propuesto.

Se lanza una moneda 3 veces. Calcular la probabilidad que ocurran

a) Dos caras
b) Al menos dos caras
c) A lo más dos caras

92
TEOREMA DE PROBABILIDAD

OPERACIONES CON SUCESOS

INTERSECCIÓN DE SUCESOS

P(A B)  P(A)  P(B)  P(A B)

Ejemplo:

De los 100 estudiantes, 30 juegan básquetbol. De ellos, 16 practican ambos; futbol y


básquetbol. 48 estudiantes no practican futbol ni básquetbol.

A=Basquetbol B= Futbol

a) Mostrar toda esta información en el diagrama de Venn Solución

100

14 16 22

48

a) Halle la probabilidad de que un estudiante elegido al azar practique futbol y


básquetbol.

16 4
P ( A ∩B )= =
100 25

b) Halle la probabilidad de que un estudiante elegido al azar no practique básquetbol,


pero si futbol.

22 11
P ( B ∩ A )=
c
=
100 50

c) Halle la probabilidad de que un estudiante elegido al azar no practica ni futbol ni


básquetbol.
48 12
P ( A ∩B ) =
c c
=
100 25

93
UNIÓN DE SUCESOS

P(A B)  P(A)  P(B)  P(A B)

Ejemplo

De los 100 estudiantes, 30 juegan bádminton. De ellos, 16 practican ambos: tiro con arco y
bádminton.

A = tiro con arco = 38 B= juegan bádminton =30

a) ¿Cuál es la probabilidad de que un estudiante elegido al azar practique bádminton o tiro


con arco?

Solución

P(A𝖴B)= ?

P(A B)  P(A)  P(B)  P(A B)

n(A𝖴B) = 38 +30 -16 =52

n( A ∪ B) 52 13
P ( A ∪ B )= = =
n(U ) 100 25

a) ¿Cuántos estudiantes practican tiro con arco o no practican bádminton?


Solución

n(A∪ Bc ) = 22+16+48 =86

n( A ∪ Bc ) 86 43
( c
P A ∩B =) = =
n(U ) 100 50

94
TEOREMA DE LA MULTIPLICACION

Sean A y B dos sucesos incluidos en el espacio muestral , entonces:

- Si A y B son sucesos no independientes

P(A  B) = P(A) x P(B/A)

Ejemplo

1. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente y sin
reposición. Calcular la probabilidad que la primera sea blanca y la segunda azul.

Solución

P(b a) = P(b) x P(a/b)

4 6 4
= x 
10 9 15

- Si A y B son independientes P(A  B) = P(A) x P(B)

PRINCIPIOS DE CONTEO

PRIMER PRINCIPIO DE CONTEO


Si un evento A ocurre de m maneras y un evento B ocurre de n maneras; el evento A o
B ocurrirá de m + n maneras, siempre que los eventos sean mutuamente excluyentes.
Analogía Matemática: si un conjunto A tiene m elementos y un conjunto B tiene n
elementos entonces el conjunto a A U B tendrá m +n elementos, sí A  B = .

A B
#(A) = m
 #(A  B) = m + n, si A  B = 
#(B) = n

95
Generalización: Si los eventos A i ocurren de ni maneras, i = 1, 2, ……k, ,
respectivamente, entonces el evento ¿ i=1 ¿ k A i ocurrirá de n1 + n2 + ……..+ nk
maneras, siempre que estos eventos sean mutuamente excluyentes.
Ejemplo 10:
Sea  = { 1, 2,3, 4, 5, 6} un Espacio Muestral que resulta del experimento aleatorio de
lanzar un dado sobre una mesa. Y sean los eventos A = { 1, 3 } y B = { 2, 4, 6 }.
El evento A ocurre de dos maneras (ocurre cuando sale 1 ó 3 ) y el evento B ocurre de
tres maneras (ocurre cuando sale 2, 4 ó 6); entonces, como los eventos son
mutuamente excluyentes, el evento A ó B ocurrirá de 2 + 3 = 5 maneras (ocurrirá si
sale 1, 3, 2, 4 ó 6).
Analogía Matemática: El conjunto A tiene 2 elementos y el conjunto B tiene 3
elementos  como A  B = , el conjunto A  B tendrá 2 + 3 = 5 elementos; en efecto,
A  B = {1,2,3,4,6} tiene 5 elementos.

SEGUNDO PRINCIPIO DE CONTEO


“Si una operación A puede efectuarse de m maneras y (cuando ha sido efectuada de
cualquiera de esas maneras) una segunda operación B puede efectuarse de n maneras;
entonces, las dos operaciones A y B (en ese orden) se efectuarán de m x n maneras”.
O también se puede considerar como una selección (o elección) de opciones (u
ocurrencias): “Si existen m opciones (u ocurrencias) posibles en la primera selección (o
elección) y n opciones (u ocurrencias) posibles en la segunda selección (o elección);
entonces habrá m x n resultados diferentes en la selección (o elección) sucesiva de las
dos opciones (u ocurrencias)”.
Analogía Matemática: Si un conjunto A tiene m elementos y un conjunto B tiene n
elementos, entonces el conjunto A x B (Producto Cartesiano) tendrá m x n elementos.

Ejemplo 11:
Existen 3 caminos (u opciones) diferentes para ir de la ciudad P a la ciudad Q y existen
4 caminos (u opciones) diferentes para ir de Q a R. ¿De cuantas rutas diferentes se
dispone para ir de P a R?

96
Observando la figura y por el segundo Principio de Conteo, disponemos de 3 x 4 = 12

rutas diferentes para ir de P a R.

La operación A puede efectuarse de 3 maneras (rutas para ir de P a Q, la operación B

puede efectuarse de 4 maneras (4 rutas para ir de Q a R), entonces las dos operaciones

A y B se efectuaran de 12 maneras (existen 12 rutas diferentes para ir de P a R).

Ejemplo 12
Un experimento Aleatorio consiste en lanzar un dado dos veces y que los eventos
sean:
A = {En el primer lanzamiento resulte impar}
B = {En el segundo lanzamiento resulte par}
C = {Que en el primer lanzamiento resulte impar y en el segundo resulta par}
¿De cuantas maneras ocurrirá el evento C?
Solución:
A = {1, 3, 5}, B = {2, 4, 6}  El evento C ocurrirá de 3 x 3 = 9 maneras (segundo
principio de conteo).
Por la Analogía Matemática: A x B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6), (5, 2), (5,
4), (5, 6)}. Tiene 9 elementos. Son las nueve maneras de ocurrencia del evento C.

97
EJERCICIOS DESARROLLADOS

1. Determinar la probabilidad de que al lanzar un dado, el resultado sea un número


primo.

Solución

 = 1,2,3,4,5,6

A = 2,3,5

 P(A) = 3/6 = 1/2

2. ¿Cuál es la probabilidad que al lanzar dos dados, su suma sea un múltiplo de 3?

Solución:

Para que sea múltiplo de 3, la suma debe ser 3,6,9 o 12, siendo los casos favorables de 2,5,4 y
1 respectivamente, que en total hacen 2+5+4+1, igual a 12 casos favorables, con respecto a 36
casos en total.

Por lo tanto, la probabilidad será:

12 1
=
36 3

3. De un mazo de 52 cartas, al extraer una de ellas ¿Cuál es la probabilidad de que sea un


as?

Solución:

Para el caso de NAIPES:

Debemos saber que el mazo consta de 52 cartas:

- palo de 13 cartas de corazones()

- palo e 13 cartas de diamantes ()

- palo de 13 cartas de Tréboles ()

- palo de 13 cartas de Espadas ()

Como en un mazo de 52 cartas hay 4 ases, entonces la probabilidad será:

4 1
=
52 13

4. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente,
con reposición. Calcular la probabilidad que la primera sea azul y la segunda blanca.

Solución:

98
P(a y b) = P(a) x P(b)

6 4 6
x =
= 10 10 25

5. De una caja que contiene 5 bolas rojas y 3 negras, se extrae uno de ellos al azar.
Determinar la probabilidad que sea negra.

Solución

n () = 8

n (N) = 3 => P(N) = 3/8

6. De un mazo, se extraen 2 cartas ¿Cuál es la probabilidad que sean espadas?

Solución:

Como en un mazo de 52 cartas hay 13 espadas, por el método de las combinaciones, tenemos
que:

1
13 52
La probabilidad será: C 2 /C 2 = 17

7. En una urna se tiene 4 bolas negras, 5 blancas y 7 verdes. Al extraer tres de ellas, ¿Cuál
es la probabilidad que sean negras?

Solución:

La probabilidad será de

4 . 3 .2 1
=
C 43 /C16
3 = 16 . 15. 14 140

8. Se tienen 10 objetos buenos, 4 dañados y otros 2 con daños importantes. ¿Cuál es la


probabilidad que, al sacar 2 objetos al azar, éstos sean buenos?

Solución:

En total son: 10+4+2 = 16 objetos en total

Por el método de las fracciones, será:

10 9 3
x =
16 15 8
Por el método de las combinaciones:

C10
2 10 . 9 3
=
16 16 . 15
=
C2 8

99
9. Determina la probabilidad de realizar el siguiente suceso: “Obtener cara por lo menos
2 veces al lanzar al aire 3 veces una moneda”

Solución:

Trabajar con un diagrama del árbol.

Como nos piden hallar la probabilidad de sacar por lo menos 2 caras, esto es 2 o más caras,
entonces las caras favorables que observamos en la tercera columna son: ccc, ccs, csc y scc,
siendo 4 posibilidades de un total de 8, luego:

4 1
=
P(por lo menos 2 caras) = 8 2

10. En una caja hay 5 bolas rojas y 3 negras. Sin mirar se saca una bola y no se devuelve a
la caja, luego se saca otra bola. ¿Cuál es la probabilidad de que las dos bolas que se
sacaron sean rojas?

Solución:

5 5
=
La probabilidad de sacar una bola roja la primera vez es de: 5+3 8 , y la probabilidad de
5−1 4
=
sacar una bola roja la segunda vez es de: 8−1 7 .

Como la ocurrencia de los sucesos están ligadas mutuamente, aplicamos el teorema dado:

5 4 20 5
x = =
P(R y R) = P(R) + P(R) = 8 7 56 14

11. Se escogen al azar 4 naranjas entre 10 naranjas que habían en una caja, de las cuales 6
estaban malogradas, ¿Cuál es la probabilidad de que 2 exactamente sean malogrados?

Solución:

Según los datos se tiene:

4 sanos

Total de naranjas: 10 6 malogrados

a) Si se extraen 4 naranjas del total de naranjas (10), entonces el número de maneras se


obtendrá:

10 x 9 x 8 x 7
C 10
4 = =
1 x 2 x 3 x 4 210 maneras

b) Si se extraen 4 naranjas, donde dos naranjas deben ser malogradas entonces los otros
dos serán sanas.

100
12. El conjunto de casos posibles de extraer dos naranjas malogradas de los 6 y 2 sanas de
los 4 será.

6x5 4 x 3
C 62 x C 42 = x
2 2 = 90 maneras

 la probabilidad es de:

90 3
=
P(A) = 210 7

13. Un profesor de aula ha seleccionado a 10 niños y 4 niñas para recitar 3 poesías para
actuación central del aniversario del plante. ¿Cuál es la probabilidad de que los dos
primeros sean niños y la última sea niña?

Solución:

Según los datos el total de alumnos seleccionados son:

10 niños 14 alumnos
4 niños
Determinando las probabilidades tenemos:
10 5
=
Que el primero sea niño: 14 7
9
Que el segundo sea niño: 13
4 1
=
Que el tercero sea niña: 12 3
Como los tres eventos son independientes uno del otro, la probabilidad final será:
5 9 1 15
x x =
P(F) = 7 13 3 91

14. Nueve personas se sientan al azar en una mesa redonda. ¿Cuál es la probabilidad de
que 3 personas queden contiguas?
Solución:

Sean A, B y C las personas que van a sentarse siempre juntas o contiguas, entonces:

Calculamos el número total de formas en que se puedan sentar las 9 personas: (9-1)!= 8!

Si las 3 personas (A, B y C), siempre están juntos, entonces las formas que se pueden ubicar es:

3 x 2 x 1 = 6 formas

Las 6 personas restantes se podrán ubicar de: 6! formas

Finalmente, la probabilidad (P(A)) de que las tres personas queden contiguas es:

101
6 x 6! 6 x 6! 3
= =
(P(A)) = 8 ! 8 x 7 x 6 ! 28

102

También podría gustarte