[go: up one dir, main page]

0% encontró este documento útil (0 votos)
182 vistas11 páginas

02 - 08 I Grupo Docente Perú I Sec. Matemática

Cargado por

Rodwel Torres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
182 vistas11 páginas

02 - 08 I Grupo Docente Perú I Sec. Matemática

Cargado por

Rodwel Torres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 11

VIERNES 02 – 08 – 2024

CAPACITACIÓN PARA NOMBRAMIENTO Y ASCENSO EN LA CPM 2024


ESPECIALIDAD: MATEMÁTICA – CASUÍSTICA

Tema: Estadística: Medidas de posicionamiento y de


dispersión

ALGUNOS CONCEPTOS SOBRE MEDIDAS DE POSICIONAMIENTO Y DE DISPERSIÓN

MEDIDAS DE DISPERSIÓN

Las medidas de posición central (media, mediana y moda) exploran el


centro de un conjunto de datos. Las medidas de dispersión indican
cuánto varían los datos respecto de un valor central.

EL RANGO
El rango es la medida de dispersión más sencilla de calcular pero puede verse afectada por los valores
extremos. No indica cómo se distribuyen los datos restantes.
Se calcula encontrando la diferencia entre el mayor y el menor valor de los datos presentados.
Por ejemplo:
En los datos 12, 23, 34, 45, 43, 42, 22, 22, 62, 45, 74, 45,37, 83, 28, 52, 65, 72, 63, 82, 62, 81, 79.
Por tanto: Rango es 83 – 12 = 71

LOS CUARTILES
La mediana de un conjunto de datos separa los datos en dos mitades; una mitad con los valores menores a la
mediana, la otra mitad con los valores mayores a la mediana. Los cuartiles separan el conjunto original de
datos en cuatro secuencias iguales. Cada una de estas secciones contiene una cuarta parte (25%) de los datos.
Primer El primer cuartil es el valor que marca la primera sección.
cuartil Una cuarta parte de los otros datos se halla por debajo del primer cuartil y tres cuartas partes
por arriba. También se lo llama el percentil 25 y a menudo se lo denota con el símbolo:
1
Q1= ( n + 1) − ésimo valor
4
Segundo El segundo cuartil es le mediana del conjunto de datos. También se le llama Percentil 50.
cuartil
Tercer El tercer cuartil es el valor que marca la tercera sección. Tres cuartas partes de los datos se
cuartil hallan debajo del tercer cuartil y la otra, por arriba. También se lo llama el percentil 75 y se le
denota con el símbolo:
3
Q3= ( n + 1) − ésimo valor
4
El rango y el rango intercuartil son medidas de dispersión apropiadas, pero cada una de ellas se calcula
utilizando solamente dos valores del conjunto de datos.

DIAGRAMA DE CAJA Y BIGOTES


Las medidas de posicionamiento (Los valores extremos y los
cuartiles) los podemos representar en un diagrama conocido
como “diagrama de caja y bigotes” o “box plot” o
simplemente “diagrama de caja”
El primer y el tercer cuartil están en los extremos de la caja,
Mín( x) Máx( x)
la mediana se indica mediante un segmento vertical en la Q1 Q2 Q3
Me
caja y el máximo y el mínimo están en los extremos de los
bigotes.

Pág. 2
El siguiente diagrama de caja y bigotes muestra los datos.
 El diagrama debe ser dibujado a
escala. Por ejemplo, en papel
cuadriculado o milimetrado.
 Existen diversos softwares que
nos permiten representar
información estadística en
gráficos de caja y bigotes, como
por ejemplo los más comunes
Excel, geogebra, Se puede
dibujar un diagrama de caja y
bigotes en la calculadora fx-
A los valores de extremos o muy distantes se les llama valores no 9860 GII SD.
esperados o valores atípicos. Un valor no esperado es cualquier valor que
se encuentra al menos 1,5 (RIC) por arriba de Q3 o por debajo de Q1 .

¿Cómo se construye un diagrama de caja y bigotes? y ¿cómo se determinan los valores no


esperados?
Ejemplo 1: Se realiza un Congreso de docentes IB en Lima a donde asisten un grupo de docentes cuyas
edades se muestran en la tabla de distribución adjunta. Construye el diagrama de caja y bigotes.
Edad: Frecuenci Frecuencia Determinamos:
xi a simple: acumulada • Cuartil 1 Q1 .
1
Lugar que ocupa: (19 + 1) =
5 ⇒ Q1 = 40
fi : Fi 4
2
29 1 1 • Cuartil 2 Q2 = Me . Lugar que ocupa: (19 + 1) =10 ⇒ Q
=2 = 48
Me
4
34 2 3 3
39 1 4 • Cuartil 3 Q3 . Lugar que ocupa: (19 + 1) =
15 ⇒ Q3 = 55
4
40 2 6 • Extremos: Máx.=81; Mín.=29
42 1 7 • Rango intercuartil RIC = Q3 − Q1 = 55 − 40 = 15
47 2 9 Valores no esperados (atípicos):
48 1 10 V. NE (menores): V .NE < Q1 − 1,5( RIC )
53 3 13 V .NE < 40 − 1,5(15)
54 1 14 V .NE < 17,5
55 2 16 V. NE (mayores): V .NE > Q3 + 1,5( RIC )
60 1 17 V .NE > 55 + 1,5(15)
62 1 18 V .NE > 77,5
81 1 19
Total 19 ----

Mín Q1 Q3 Máx

20 30 40 50 60 70 80 90

∼ El 50 % de docentes que asistieron al congreso tienen edades de 40 a 55 años.


∼ No se esperaba la presencia de un docente de 81 años.
∼ Existe un 25 % de docentes que tienen menos de 40 años pero mayores o iguales a 29.

Pág. 3
Hallamos los cuartiles para datos agrupados en clases:
Para hallar los cuartiles para datos agrupados en clases, se usa la siguiente fórmula:
a  k.n 
Qk =
Linf +  − Fi−1 
fi  4 

Donde: Qk: Cuartil de lugar k


Linf: Límite inferior donde se encuentra el cuartil k.
a: Amplitud o ancho de la clase.
k: Número de cuartil (1; 2 o 3)
n: Cantidad de datos.
Fi-1: Frecuencia acumulada anterior a la del intervalo del cuartil que se está
calculando.
Ejemplo 2.
En La I.E. Carlos Manuel Cox, las edades (en años) de Intervalo Cantidad de Frecuencia
i
los maestros obtenidos a través de una encuesta se de edades docentes (fi) Acum. (Fi)
encuentran en la siguiente tabla: 1 [25; 30〉 3 3
Halle los cuartiles de las edades de los maestros y 2 [30; 35〉 4 7
realice la interpretación de dichos estadígrafos y del
3 [35; 40〉 9 16
rango intercuartil.
Resolución 4 [40; 45〉 10 26
Después de completar la tabla hallamos la clase 5 [45; 50〉 16
respectiva donde está cada cuartil: 6 [50; 55〉 12
1 × 60 7 [55; 60〉 4
a) Posición del Q1 = = 15 ⇒ Q1 ∈ [35; 40〉
4 8 [60; 65〉 2
(i=3)
TOTAL
Para hallar el Q1 aplicamos la fórmula:
a  k.n 
Qk =
Linf +  − Fi−1 
fi  4 

Donde:
Linf = 35 a=5 f3 = 9 k=1 n = 60 F3-1 = 7
a  k.n 
Reemplazamos en la formula: Q 1 =
Linf +  − F2 
f3  4 
5  1 × 60  5
Q 1 = 35 +  − 7  = 35 + (8) = 35 + 4,44 = 39,4
9 4  9
Q 1 = 39,4
Interpretación:
- Según el cuartil 1, podemos afirmar que el 25% de docentes tienen una edad menor o igual a 39 años.
El 75 % tiene más de 39 años.
Realizamos el mismo proceso para los cuartiles 2 y 3.

Pág. 4
VARIANZA Y DESVIACIÓN ESTÁNDAR
La varianza combina todos los valores del conjunto de datos para crear una medida de dispersión. Se calcula
como la media aritmética de los cuadrados de las diferencias entre cada dato y la media de los datos. Elevar al
cuadrado la diferencia entre cada dato y la media tiene por lo menos tres ventajas:
 Elevar al cuadrado hace que cada término sea positivo con lo cual los valores por arriba de la misma no
se cancelan con los valores por debajo de la misma.
 Elevar al cuadrado les agrega peso a alas diferencias grandes.
 En muchos casos este peso adicional resulta apropiado, dado que los puntos que están más lejos de la
media pueden ser más significativos.
El uso de esta medida facilita de alguna manera las operaciones matemáticas en cálculos estadísticos
posteriores, dado que las diferencias se elevan al cuadrado, las unidades de varianza no son las mismas que
las unidades de los datos.
La desviación estándar de un conjunto de valores, es la medida de variación de los valores con respecto a la
media.
Para calcular la desviación estándar, primero se calcula la varianza: Se obtiene al promediar los cuadrados de
las diferencias de cada dato con respecto a la media.
Finalmente, para obtener la desviación estándar, se saca la raíz cuadrada a la varianza.
FÓRMULAS:
Para todos los datos de una población:
(Se aplica esta fórmula cuando se utiliza a todos los datos de una situación de estudio)
n n
∑ (xi − x)2 ∑ (xi − x)2
Varianza: σ2 =i=1 ⇒ Desviación estándar: σ= i=1
n n

Para todos los datos de una muestra:


(Se aplica esta fórmula cuando se utiliza a los datos de una muestra obtenida de una situación de estudio)
n n
∑ (xi − x)2 ∑ (xi − x)2
Varianza: S2 = i=1
⇒ Desviación estándar: S= i=1
n−1 n−1

COEFICIENTE DE VARIACIÓN
El coeficiente de variación es el cociente de la desviación entre la media:
σ
CV = donde x > 0
x
Esta medida permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean
positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

Pág. 5
PROBLEMAS DE APLICACIÓN Y CASUÍSTICA
1. Un docente les propone a los estudiantes la siguiente situación:
Un diagrama de cajas muestra el valor mínimo (Xmín), los tres cuartiles (Q1, Q2 y Q3), y el valor
máximo (Xmáx) de un conjunto de datos.
Con los datos de las edades de 20 personas que pertenecen a un colectivo social, se realizó el
siguiente diagrama de cajas:

El docente les solicita a los estudiantes que propongan conclusiones a partir del diagrama presentado.
Tres estudiantes respondieron a lo solicitado por el docente. ¿Quién planteó una afirmación correcta?
a) Xavier dice: “La mitad de los datos están por debajo de 33,5 años”.
b) Yola dice: “Desde el valor mínimo hasta el valor máximo, hay 25 datos”.
c) Zenón dice: “Hay más datos entre el primer y segundo cuartil, respecto de los demás intervalos”.

2. Raúl, Susana y Teresa trabajan en una misma empresa. Los salarios de los trabajadores de esta empresa
se calculan según el cargo y las funciones que desempeñan. Además, se sabe que el primer cuartil de los
salarios es 2000 soles, la mediana es 2300 soles y el tercer cuartil es 3000 soles.

Teniendo en cuenta esta información, ¿cuál de las siguientes afirmaciones es verdadera?


a) Raúl gana 1650 soles; por lo tanto, su salario está por encima del 25 % de los salarios de los
trabajadores que menos ganan en la empresa.
b) Teresa gana 2800 soles; por lo tanto, su salario está dentro del 25 % de los salarios de los trabajadores
que más ganan en la empresa.
c) Susana gana 2500 soles; por lo tanto, como mínimo, el 25 % de los trabajadores de la empresa ganan
más que ella.

3. Una docente ha propuesto el siguiente problema a los estudiantes:


El entrenador de un equipo de básquet pretende incorporar a un jugador que sea muy hábil
encestando. Se presentan dos candidatos: Juan y Pablo. Para tomar su decisión final, el entrenador
considerará los puntos que hagan al encestar en los partidos que enfrenten a los equipos A, B, C y D.
En la siguiente tabla, se indican los puntos que hicieron al enfrentar a dichos equipos.
Equipos Puntos de Juan Puntos de Pablo
Equipo A 26 30
Equipo B 23 20
Equipo C 24 20
Equipo D 25 28
El asistente técnico recomendó al entrenador que incorpore a Juan, con el argumento de que es el
jugador con mayor regularidad en los puntos realizados en cada partido. Explica cuál es la posible
medición que consideró el asistente para hacer dicha recomendación.
¿Cuál es el propósito que busca lograr la docente con el problema propuesto?
a) Que los estudiantes justifiquen el uso de una de las medidas de dispersión en la resolución de un
problema.
b) Que los estudiantes fundamenten la pertinencia de la medida de tendencia central elegida en la
resolución de un problema.
c) Que los estudiantes expliquen el procedimiento más eficaz para el cálculo de una medida de
dispersión como parte de la resolución de un problema.

Pág. 6
4. Un docente tiene como propósito que los estudiantes desarrollen autonomía sobre su aprendizaje de las
medidas de posición.
¿Cuál de las siguientes acciones pedagógicas es más pertinente para ello?
a) Pedirles que indaguen sobre situaciones en las que son útiles las medidas de posición. Luego,
solicitarles que conversen sobre las dificultades que tuvieron para comprender estas medidas de
posición. Finalmente, monitorear el trabajo de elaboración de estrategias para superar dichas
dificultades.
b) Pedirles que dialoguen sobre las medidas de posición y su aplicación en diversas situaciones. Luego,
solicitarles que, por su cuenta, sistematicen la información dialogada, apoyándose en un organizador
visual. Finalmente, sugerirles que compartan su trabajo con sus compañeros con el fin de mejorarlo.
c) Pedirles que busquen situaciones que se han resuelto empleando medidas de posición como cuartiles
que son los más conocidos. Luego, solicitarles que repasen las estrategias aplicadas en dichas
situaciones. Finalmente, explicarles sobre las medidas de posición y presentarles un organizador de
la información.

5. Diana, Raúl y Catalina estudian en un mismo instituto superior. Los estudiantes de este instituto rindieron
una evaluación de progreso. Las notas se calculan en una escala de 0 a 1000 puntos. Además, se sabe que
el primer cuartil de las notas es 450 puntos, el segundo cuartil es 680 puntos y el tercer cuartil es 800
puntos.
Teniendo en cuenta esta información, ¿cuál de las siguientes afirmaciones es verdadera?
a) Diana obtuvo 840 puntos; por lo tanto, su nota está por encima del 75 % de las notas de los
estudiantes del instituto.
b) Raúl obtuvo 400 puntos; por lo tanto, su nota está por encima del 25 % de las notas de los
estudiantes del instituto.
c) Catalina obtuvo 700 puntos; por lo tanto, su nota está por debajo del 50 % de las notas de los
estudiantes del instituto.

Lea la siguiente situación y responda las preguntas 6, 7 y 8.


Un docente presentó a los estudiantes la siguiente situación:
Una fábrica produce rodajes, que es una pieza metálica que usa bolitas de acero. Las empresas A y B proveen
estas bolitas a la fábrica, cuyo principal requerimiento es que todas las bolitas de acero midan exactamente
12 mm de diámetro; sin embargo, por razones de producción, ni la empresa A ni la empresa B logran hacerlas
todas iguales.
La fábrica de rodajes mide con aparatos de mucha precisión los diámetros de las bolitas y, sobre la base de
estas mediciones, encuentra los siguientes valores:
En el caso de la empresa A, el promedio de las medidas de los diámetros es 12 mm y su desviación estándar es
1,08 mm, mientras que, en la empresa B, el promedio de las medidas de los diámetros es 12 mm y su desviación
estándar es 1,24 mm.

6. El docente les pidió a los estudiantes que analizaran la situación y que respondan a la siguiente pregunta:
“¿Qué conclusiones se pueden extraer de los datos?”.
Uno de los estudiantes concluyó: “En el caso de la empresa A, la medida máxima del diámetro de las
bolitas de acero es 13,08 mm y la mínima es 10,92 mm”.
¿Cuál de las siguientes alternativas expresa el error en el que incurre este estudiante?
a) Considerar que el rango de las medidas de los diámetros de las bolitas suministradas por la
empresa A está dado por una desviación estándar por encima y por debajo del promedio de dichas
medidas.

Pág. 7
b) Considerar que la medida máxima y mínima de los diámetros de las bolitas suministradas por la
empresa A se obtienen de multiplicar y dividir, respectivamente, el promedio y la desviación
estándar.
c) Considerar la desviación estándar como el promedio de los valores absolutos de las diferencias de
las medidas de los diámetros de las bolitas suministradas por la empresa A y el promedio de dichas
medidas.

7. El docente planteó la siguiente pregunta:


“¿Cuál de las dos empresas proveedoras de bolitas de acero tiene menos margen de error respecto al
requerimiento de la fábrica de rodajes?”.
Uno de los estudiantes presentó su resolución:

El docente busca retroalimentar al estudiante para que reflexione sobre la resolución que presentó.
¿Cuál de las siguientes acciones pedagógicas es la más pertinente para conseguir este propósito?
a) Explicarle que el coeficiente de variación es una medida que permite comparar, entre ambas
empresas, la dispersión de las medidas de los diámetros con respecto a su promedio. Luego, decirle
que, para su comprensión, es mejor expresarlo en porcentajes. Finalmente, solicitarle que verifique
si su respuesta es correcta.
b) Preguntarle qué entiende por “tener menos margen de error respecto al requerimiento de la
empresa de rodajes” y pedirle que compare los promedios, las desviaciones estándar y los
coeficientes de variación de ambas empresas. Finalmente, solicitarle que repase sus operaciones
para saber si son correctas.
c) Pedirle que mencione qué entiende por coeficiente de variación. Luego, mediante preguntas
orientarlo a que entienda la relación entre la desviación estándar y el promedio como la relación de
una parte respecto del total. Finalmente, solicitarle que revise su procedimiento para saber si es
correcto.

8. Con el propósito de promover la comprensión de la desviación estándar, un docente les presenta a los
estudiantes el siguiente problema:
El director de un instituto de estudios superiores está interesado en comparar la dispersión de las
calificaciones de los estudiantes del primer y segundo ciclo de estudios. El director sabe que el
promedio de calificaciones del primer ciclo es 18 y su desviación estándar, 5 y el promedio del
segundo ciclo es 12 y su desviación estándar, 4. ¿Qué grupo de estudiantes presenta calificaciones
con menor dispersión?
Ante esto, una estudiante realiza el siguiente comentario:
Al comparar las desviaciones estándar, como 4 es menor que 5, entonces las calificaciones del
grupo de estudiantes del segundo ciclo presentan menor dispersión.

Pág. 8
El docente nota que la estudiante incurre en el error de comparar las desviaciones estándar sin tomar en
cuenta los promedios de las calificaciones de cada grupo de estudiantes.
¿Cuál de los siguientes grupos de preguntas es más pertinente para retroalimentar a la estudiante?
a) ¿Qué porcentajes representan las desviaciones estándar respecto de sus promedios? ¿Qué notas al
comparar estos porcentajes? ¿Es conveniente considerar también los promedios en tu comparación?
¿Por qué?
b) ¿Qué medida permite comparar la variabilidad de dos conjuntos de datos con desviaciones estándar
y promedios distintos? ¿Cómo se calcula esta medida? ¿Obtuviste las mismas conclusiones al
comparar estos valores?
c) ¿Se podrá comparar la dispersión de dos conjuntos sin tener las calificaciones? ¿Qué indica que un
conjunto de datos tenga menor desviación estándar que otro? ¿Qué afirmarías si las desviaciones
estándar hubiesen sido iguales? Al comparar las desviaciones estándar, como 4 es menor que 5,
entonces las calificaciones del grupo de estudiantes del segundo ciclo presentan menor dispersión.

9. Con el propósito de que afiancen su comprensión sobre las medidas de dispersión, el docente propone a
los estudiantes diversas tareas.
¿Cuál de las siguientes tareas es de mayor demanda cognitiva?
a) Expresar el valor que tendría la desviación estándar de las medidas de los diámetros de un conjunto
de bolitas de acero, cuyo promedio de estas medidas es 12 mm y el coeficiente de variación es 0,12.
b) Proponer un valor para el promedio y otro para la desviación estándar, de tal modo que las medidas
de los diámetros de las bolitas de acero tengan menor margen de error respecto al requerimiento de
la fábrica de rodajes, en comparación con las suministradas por las empresas A y B.

c) Calcular el coeficiente de variación en relación con las medidas de los diámetros de las bolitas de
acero de una empresa C, que también es proveedora de la fábrica de rodajes, asumiendo que el
promedio de las medidas de los diámetros de estas bolitas es 12 mm y su desviación estándar es la
décima parte del promedio.

10. Un docente tiene como propósito evaluar el logro del siguiente desempeño: “Interpreta gráficos usando
el significado de la desviación estándar”. Para ello, propone la siguiente tarea:

Para evaluar las respuestas de los estudiantes, el docente utiliza una rúbrica con cuatro niveles cuyas
descripciones son las siguientes:

Pág. 9
Diego, uno de los estudiantes, elaboró las siguientes conclusiones:

Según la rúbrica presentada, ¿cuál es el nivel de logro alcanzado por Diego?


a) En proceso.
b) Logrado.
c) Destacado.

11. Un docente plantea a los estudiantes la siguiente situación:


La tabla que se presenta a continuación muestra la cantidad de niños que atendió la posta médica de un
centro poblado en cierto día.

En este contexto, el docente propone diversas tareas. ¿Cuál de las siguientes tareas propuestas es de
mayor demanda cognitiva?
a) Se requiere repetir los análisis de los pacientes cuya edad coincide con la mediana de las edades de
todos los pacientes. El mismo procedimiento se debe realizar con los pacientes cuya edad coincide
con el segundo cuartil de todas las edades. ¿Qué relación existe entre estos pacientes?
b) Se hará un taller sobre factores de riesgo de enfermedades infecciosas con los padres de los pacientes
que se encuentran por debajo del segundo decil. ¿Cuál es la edad que corresponde al segundo decil
de las edades de los pacientes?
c) Se debe aplicar una encuesta de satisfacción a los padres o apoderados de los pacientes que
corresponden al primer, segundo y tercer quintil, según su edad. ¿Cuáles son las edades de estos
pacientes?

Pág. 10
12. Una docente presenta una actividad que involucra una situación en la que se indica la cantidad de minutos
que empleó cada estudiante de quinto grado para desarrollar una prueba escrita.
Como parte de la actividad, ella solicita que determinen el tercer cuartil; el cual corresponde al valor del
tiempo que delimita los valores de la cuarta parte de los estudiantes que emplearon más tiempo en
desarrollar su prueba.
Durante el monitoreo, la docente se percata de que uno de los estudiantes, al determinar el tercer
cuartil, omite ordenar previamente los datos.
La docente busca brindar retroalimentación al estudiante de modo que reflexione sobre su error. ¿Cuál
de los siguientes grupos de preguntas es más pertinente para ello?
a) ¿Se debería ordenar previamente el conjunto de datos para hallar el tercer cuartil? ¿Qué función
tendría tal ordenamiento de los datos? ¿Se puede aceptar que una medida de posición ignore el
orden?
b) ¿Cómo has calculado el valor del tercer cuartil? ¿Cumple la condición de establecer la cuarta parte
del grupo de estudiantes? ¿Los tres cuartiles determinan cuatro grupos, todos con igual cantidad de
datos?
c) ¿Qué característica común deben tener todos los valores que superan el tercer cuartil? En esa
cuarta parte de datos que se ha delimitado, ¿hay algún valor que no tiene esa característica?, ¿por
qué crees que ocurre eso?

Pág. 11

También podría gustarte