Mathematics">
Medidas Estadistica
Medidas Estadistica
Medidas Estadistica
A hora trataremos de presentar otros métodos para estudiar o medir el comportamiento de los elementos que
constituyen una población. Si bien es cierto que los cuadros y graficas describen el fenómeno, no lo hacen en
forma satisfactoria, y por tanto hay necesidad de acudir a ciertas medidas denominadas parámetros de la
población, cuando se hacen sobre el total de ésta y estadígrafos, cuando corresponden a una parte de la
población o muestra. Los estadígrafos permiten hallar un valor numérico, el mismo que representa a la muestra.
Teniendo en cuenta la anterior la clasificación, los símbolos que se refieren a la población se representan
generalmente por letras griegas o por las letras mayúsculas de nuestro alfabeto y los que se refieren a la
muestra, por letras minúsculas.
Para el análisis de una variable o de una distribución unidimensional se consideran las siguientes clases de
medidas:
Medidas de tendencia central
Medidas de posición
Medidas de dispersión
Medidas de asimetría y apuntamiento
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de
tendencia central o de centralización.
Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de
que esta esté más o menos centrada, sirven como puntos de referencia para interpretar las valoraciones que se obtienen en
un conjunto de observaciones.
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
Un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
Entre las medidas de tendencia central tenemos:
Media aritmética o promedio, media ponderada, media geométrica, media armónica, Mediana, Moda.
N: es el numero de datos.
Li-1 es el límite inferior de la clase donde se encuentra la mitad de los datos.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
fi es la frecuencia absoluta de la clase mediana.
RANGO O RECORRIDO
Sobre esta medida ya se había trabajado en la construcción de las tablas de frecuencia agrupada. Se trata de la diferencia
entre el límite superior y el límite inferior de un conjunto de datos. Es la medida de dispersión más fácil de calcular, sólo
requiere que los datos estén ordenados. Pero es poco usada como medida de dispersión porque se deja afectar fácilmente
de los valores extremos de poca frecuencia.
Desviación media
Se define como la media aritmética de las desviaciones respecto a la media, tomadas en valor absoluto5. Es una de las
medidas más fáciles de calcular y por ello, muy usada. Ella toma todos los valores de la variable y es menos afectada que la
desviación estándar por los valores extremos. Su valor siempre será menor que la desviación estándar. Cuanto mayor sea el
valor de la desviación media, mayor será la dispersión de los datos; sin embargo este valor no proporciona una relación
matemática precisa con la posición de un dato dentro de la distribución y, puesto que se toman los valores absolutos, mide la
desviación de una observación sin determinar si está por encima o por debajo de la media aritmética.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.
Para datos no agrupados:
Las unidades de la varianza son los cuadrados de las unidades de los datos: pesos cuadrados, alumnos
cuadrados, etc., medidas difíciles de interpretar. De allí que la varianza de origen a la desviación típica o
estándar.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza, tomando siempre el valor positivo. Se simboliza por s en la
muestra y σ en la población. Esta es la medida de dispersión más conocida y más utilizada en el análisis de
datos estadísticos.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Coeficiente de variación
El coeficiente de variación indica la desviación relativa de los datos respecto a la media. Para comparar dos
distribuciones, en cuanto a su variabilidad relativa, se pueden utilizar de manera que el resultado indique cuál de
ellas es más homogénea o cuál es más heterogénea.
Es la relación entre la desviación típica de una muestra o población y su media.
MEDIDAS DE FORMA
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la
distribución, con la distribución normal.
1) ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a
reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las
características de la distribución de datos sin necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte
izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una
distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor
que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a
ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en
forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como
de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su
mediana y su moda son iguales, en símbolos = Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte
derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es
decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media
aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en
símbolos
Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de
Asimetría de Pearson:
= media aritmética.
Md = Mediana.
MO = moda
S = desviación típica o estándar.
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
Dónde:
= cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de clase
Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As = 0 ? la distribución será simétrica
Si As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
2.2) MEDIDAS DE
CURTOSIS
Medida de Fisher
Para datos sin
agrupar se
emplea la
siguiente fórmula:
Xi = cada uno de los valores; n= número de datos; X́ = media aritmética; σ 4= Cuádruplo de la desviación
estándar poblacional; f = frecuencia absoluta; Xi = marca de clase
Nota:
Si a < 3 ? la distribución es platicúrtica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
UNIVERSIDAD POPULAR DEL CESAR SECCIONAL AGUACHICA
TALLER DE ESTADISTICA DESCRIPTIVA
PROFESOR HERMES ENRIQUE MEJIA ACONCHA
1. en la tabla que sigue se da la distribución de frecuencia de los pesos en kilogramos de los empleados de una
fábrica. Con lo cual se pide: el número de empleados con un peso que no excedan a 109,5Kg, establecer el tipo
de simetría de la distribución y la calase de curva de acuerdo con el apuntamiento. A demás establecer
comparaciones entre la media mediana y moda.
Clases alumnos
49,5 – 59,5 8
59,5 – 69,5 10
69,5 – 79,5 16
79,5 – 89,5 14
89,5 – 99,5 10
99,5 – 109,5 5
109,5 – 119,5 2
3. Los jornales por horas de los operarios de una industria (redondeados a la unidad) son:
62 44 42 39 37 32 30 47 58 40 58 50 43 30 41 52 37 43 46 44 57 49 41 43 42 36
52 49 64 45 46 43 37 38 54 46 36 45 47 54 49 51 40 52 38 42 40 50 46 57 46 47
54 55 53 52 42 43 50 51 56 60 43 38 42 55 45 56 59 49 52 47 65 59 56 58
Organice los datos en una distribución de continua de frecuencias, realice: un polígono de frecuencias y
determine el tipo de distribución de los datos
4. Un fabricante registró el número de artículos producidos diariamente, durante 10 días, por un grupo de 15
obreros, que operaban con base a un plan de salarios fijos. El fabricante introdujo un plan de incentivos
salariares para otros 15 obreros y registro la producción durante 10 días.
Primer grupo: 75 76 74 80 72 78 76 73 72 77
Segundo grupo: 86 78 86 84 81 79 78 84 88 80
Determine la dispersión absoluta y la dispersión relativa, y que grupo de empleados estuvo relativamente
mejor posicionado: el primero con 70 artículos o del segundo con 77 artículos
EXITOS HEMA