[go: up one dir, main page]

100% encontró este documento útil (1 voto)
189 vistas29 páginas

Estadística Descriptiva Tablas de Distribución de Frecuencias

Este documento describe los conceptos básicos de la estadística descriptiva, incluyendo tablas de distribución de frecuencias, frecuencias absolutas, relativas y acumuladas, y diferentes tipos de gráficos estadísticos como histogramas, polígonos, ojivas y diagramas de torta. Explica cómo organizar y resumir datos numéricos para visualizar patrones y distribuciones a través de la tabulación y representación gráfica de frecuencias.

Cargado por

josii
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
189 vistas29 páginas

Estadística Descriptiva Tablas de Distribución de Frecuencias

Este documento describe los conceptos básicos de la estadística descriptiva, incluyendo tablas de distribución de frecuencias, frecuencias absolutas, relativas y acumuladas, y diferentes tipos de gráficos estadísticos como histogramas, polígonos, ojivas y diagramas de torta. Explica cómo organizar y resumir datos numéricos para visualizar patrones y distribuciones a través de la tabulación y representación gráfica de frecuencias.

Cargado por

josii
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 29

Estadística Descriptiva

Tablas de Distribución de
Frecuencias
I. ESTADISTICA DESCRIPTIVA

Tablas de distribución de frecuencias.


• (Frecuencias relativas y relativas acumuladas. )Graficas
estadísticas
• Histogramas
• Polígonos
• Ojivas
• Grafico de Torta o Pastel
TABLAS DE DISTRIBUCION DE FRECUENCIAS.

Es una técnica estadística para organizar datos en clases y cada una se les aplica la
frecuencia correspondiente. Sirve para visualizar y organizar los datos. Una de los
primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de
resultados, es decir, recoger la información de la muestra resumida en una tabla en
la que a cada valor de la variable se le asocian determinados números que
representan el número de veces que ha aparecido, su proporción con respecto a
otros valores de la variable, etc. Estos números se denominan frecuencias: así
tenemos los siguientes tipos de frecuencia:
• Frecuencia Absoluta: La frecuencia absoluta de una variable estadística es el
número de veces que aparece en la muestra dicho valor de la variable, la
representaremos por ni
• Frecuencia Relativa:
• La frecuencia absoluta, es una medida que está influida por el tamaño de la
muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de
la frecuencia absoluta. Esto hace que no sea una medida útil para poder
comparar. Para esto es necesario introducir el concepto de frecuencia relativa,
que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La
denotaremos por fi
Frecuencia Relativa:

Donde n = tamaño de la muestra


Porcentaje:
• La frecuencia relativa es un tanto por
uno, sin embargo, hoy día es bastante
frecuente hablar siempre en términos
de tantos por ciento o porcentajes, por
lo que esta medida resulta de
multiplicar la frecuencia relativa por
100. La denotaremos por pi. Pi  Fi  100%
Frecuencia Absoluta Acumulada:
• Para poder calcular este tipo de frecuencias hay que tener en cuenta
que la variable estadística ha de ser cuantitativa o cualitativa
ordenable. En otro caso no tiene mucho sentido el cálculo de esta
frecuencia. La frecuencia absoluta acumulada de un valor de la
variable, es el número de veces que ha aparecido en la muestra un
valor menor o igual que el de la variable y lo representaremos por Ni.
Frecuencia Relativa Acumulada:
• Al igual que en el caso anterior la
frecuencia relativa acumulada es
la frecuencia absoluta acumulada
dividido por el tamaño de la
Ni
Fi 
muestra, y la denotaremos por Fi

N
Porcentaje Acumulado:

• Análogamente se define el porcentaje


acumulado y lo vamos a denotar por pi
como la frecuencia relativa acumulada
por 100.
Pi  Fi  100%
Ejemplo
• Veamos esto con un ejemplo: tomamos para ello los datos relativos a las
personas activas. 
Personas Número
activas familias
Xi Ni Fi Pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50
• En este ejemplo se puede ver fácilmente como se calculan estas frecuencias.
Tablas de frecuencias

• Existen dos formas diferentes de tablas de frecuencia, teniendo …


• Que la variable estadística tome pocos valores diferentes (ya sea
grande o pequeño el tamaño de la muestra).
• Que, en una muestra de gran tamaño,  la variable estadística tome
muchos valores diferentes, ya se trate de variable estadística discreta
como de variable estadística continua (este último caso es el más
habitual).
En el primer caso no
es necesario agrupar
los datos, y la tabla
de distribución
presenta el siguiente
aspecto (ordenando
los datos de menor a
mayor) :
• En el segundo caso por tratarse de variable continua o discreta pero con un número de
datos muy grande, es aconsejable agrupar los datos en clases.
• Agrupamos los valores de la variable estadística en intervalos de clase contiguos y
elegidos convenientemente para no perder mucha información. No existe un criterio
claro de cuál debe ser el número de intervalos que debemos escoger, Norcliffe establece
que el número de clases debe ser, aproximadamente igual a la raíz cuadrada positiva del
número de datos. Normalmente, el número de intervalos de clase se suele fijar entre 5 y
15 y de tal manera que en cada clase se tengan, al menos, 5 observaciones. De todas
formas el investigador los acomodará a las condiciones especificas del problema
estadístico objeto de estudio (se tomarán tantos intervalos solapados como sean
necesarios para recubrir todo el recorrido de la variable).
• Los extremos de los intervalos de clase se denominan extremos de clase y sus puntos
medios marcas de clase (valor que nos representa la información que contiene un
intervalo).
• Como cada observación debe quedar perfectamente encasillada en uno y sólo un
intervalo de clase, debemos decidir a qué intervalos pertenecen los extremos de las
clases, por lo que habrán de tomarse intervalos semiabiertos o tomando el extremo de
cada clase con un decimal más que las observaciones. Con el fin de que la clasificación
esté bien hecha, los intervalos se deben construir de manera que el límite superior de una
clase coincida con el límite inferior de la siguiente, y además, adoptando el criterio de que
los intervalos sean cerrados por la izquierda y abiertos por la derecha.
• Por otro lado tenemos la amplitud de cada intervalo, que puede ser constante o
variable. Si procuramos que todas las clases tengan la misma amplitud y los límites
de cada clase sean números redondos (múltiplos p. ej. de 5) conseguiremos
simplificar mucho los cálculos (siempre y cuando no se pierda demasiada
información con estas consideraciones).
• Debemos observar un hecho importante, se entiende que cuando hacemos una
agrupación en intervalos de clase, para nosotros solamente cuenta el número de
observaciones que caen dentro de cada uno de los intervalos y no la colocación en su
interior, es decir, suponemos que la distribución de estos valores en el intervalo es
homogénea, en esto radica la pérdida de información que supone agrupar los datos
de las observaciones.
Tabla de
frecuencias
de una
variable
estadística
agrupada
en
intervalos.
(Frecuencias relativas y relativas acumuladas.)Graficas
estadísticas

Datos f (en Fr(%)


Ejemplo. (vacunas) miles) (redondeado
• En la siguiente tabla se
muestra el total de vacunas BCG 47 17
aplicadas durante el verano de
l991 en un estado de la SABIN 111 41
República Mexicana.  
DPT 73 27

SARAMPION 41 15

TOTAL 272 100


HISTOGRAMA.

• Es una representación grafica de una distribución de frecuencias por medio de


rectángulos.
• Es un recurso común e importante para representar datos, consiste en una escala
horizontal para valores de los datos que se están representando, una escala vertical
de las frecuencias de dichos datos.
• El histograma es especialmente útil cuando se tiene un amplio número de datos que
es preciso organizar.
• Histograma de frecuencia absoluta. (Xi y fi)
• Histograma de frecuencia relativa (Xi y Fi)
• Histograma de frecuencia relativa porcentual (Xi y hi)
• Histograma de frecuencia relativa acumulada (Xi y Hi)
• Con la distribución de frec. anterior se tiene:  
POLIGONOS DE FRECUENCIA
• Es una representación grafica de la distribución de frecuencia que resulta esencialmente
equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las
bases superares de los rectángulos del histograma.
OJIVA.

• Una grafica similar al polígono de frecuencias es la ojiva, pero esta se


obtiene de aplicar parcialmente la misma técnica a una distribución
acumulativa y de igual manera que estas, existen las ojivas mayor que
y menor que.
• Una gráfica de distribución de frecuencias acumuladas es llamada una
ojiva. Se trazan los límites reales superiores contra las frecuencias
acumuladas.    
Ojiva Porcentual ó Polígono de frecuencias relativas
acumuladas.
• Se trazan los límites reales superiores contra las frecuencias relativas acumuladas.  
DIAGRAMA CIRCULAR, PASTEL O TORTA.

• Cuando lo que se desea resaltar son las proporciones que representan algunos
subconjuntos con respecto al total, conviene utilizar la grafica o diagrama circular.
Es un grafico en el que cada valor o modalidad se le asigna un sector circular de
área proporcional a la frecuencia que representan.
• Es un gráfico que se basa en una proporcionalidad entre la frecuencia y el ángulo
central de una circunferencia, de tal manera que a la frecuencia total le
corresponde el ángulo central de 360°. Para construir se aplica la siguiente
formula:
• X = frecuencia relativa * 360°/ frecuencia relativa
• Este se usa cuando se trabaja con datos que tienen grandes frecuencias, y los valores de
la variable son pocos, la ventaja que tiene este diagrama es que es fácil de hacer y es
entendible fácilmente, la desventaja que posee es que cuando los valores de la variable
son muchos es casi imposible o mejor dicho no informa mucho este diagrama y no es
productivo, proporciona principalmente información acerca de las frecuencias de los
datos de una manera entendible y sencilla.
• Se forma al dividir un círculo en sectores circulares de manera que:
•   a)      Cada sector circular equivale al porcentaje correspondiente al dato o grupo que
representa.
• b)      La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es
100.  
Datos f Grados
Fr(%)
(vacunas) (miles) (redondeados)

BCG 47 17 .17 x 360 = 61

SABIN 111 41 .41 x 360 = 148

DPT 73 27 .27 x 360 = 97

SARAMPION 41 15 .15 x 360 =54

TOTAL 272 100 360


Diagramas de caja o boxplots

• los pasos para construirlo son los siguientes:


• Dibujar y marcar un eje de medida horizontal
• Construir un rectángulo cuyo borde izquierdo esta arriba del cuarto inferior y cuyo
borde derecho esta arriba del cuarto superior
• Dibujar un segmento de recta vertical dentro de la caja arriba de la mediana
• Prolongar rectas desde cada extremo de la caja hasta las observaciones más lejanas
que estén todavía a menos de 1.5fs de los bordes correspondientes
• Dibujar un circulo abierto para identificar cada observación que caiga entre 1.5fs y
3fs del borde al cual esta más cercano estas se llaman puntos inusuales suaves
• Dibujar un circulo de línea llena para identificar cada observación que caiga a mas de
3fs del borde más cercano, estas se llaman puntos inusuales extremos
• Donde fs= cuarto superior – cuarto inferior
• Este diagrama se usa cuando se necesita la mayor información acerca de la
distribución de los datos, la ventaja que posee con respecto a los demás diagramas
es que este gráfico posee características como centro y dispersión de los datos, y la
principal desventaja que posee es que no presenta ninguna información acerca de
las frecuencias que presentan los datos

También podría gustarte