CONCEPTO DE ESTADISTICA
Desde sus inicios la Estadística se encuentra encaminada a la recolección y análisis de datos e
información que se adquiere a través de varias metodologías, ya que su principal fin es saber
interpretar de manera adecuada explicaciones concretas sobre los fenómenos de estudio a
investigar o estudiar. Esta misma se divide en dos ramas que comprenden la estadística
aplicada:
Estadística descriptiva.- Métodos de recolección, descripción, visualización, clasificación y
resumen de datos obtenidos por medio del estudio. Los datos pueden ser resumidos numérica
o gráficamente.
Inferencia Estadística.- Genera modelos y predicciones asociadas a los fenómenos teniendo
en cuenta las observaciones y población.
Variables.- Son características de una población o medio, como por ejemplo la edad, altura y
si se toma solo un valor se denomina constante.
Tipos de Variables
Cuantitativas.- Los valores se expresan en números, tales como talla, edad, etc.
Pueden ser:
* Continuas: Toman cualquier valor intermedio entre dos valores cualesquiera de la variable.
Ejemplo: concentración ambiental de un tóxico.
*Discretas: Toman valores enteros. Ejemplo: número de accidentes que se producen en un
lugar y en un intervalo de tiempo
Cualitativas.- Se expresa en categorías tales como sexo, color, etc. Pueden ser:
* Dicotómicas: Valor “si” o “no”.
* Categóricas: Valor de más de dos categorías, por ejemplo el escalafón. En función de si se
mantiene o no una relación de orden se podría distinguir entre: Ordinales y no ordinales.
Población y Muestra
Población: Los elementos a los que les realizaremos en el estudio. No tienen por qué ser
siempre personas. Población son todos los elementos a los que le vamos a hacer un estudio,
independientemente de lo que sea, ya sean piezas de una fábrica, animales, datos de cualquier
tipo…
Muestra: Se le llama muestra a una parte que es representativa de la población. La muestra
siempre será más pequeña que la población.
Entonces la población y muestra trata de la relación entre una población y sus muestras. Si la
muestra es representativa de una población, se sacarían conclusiones importantes sobre la
población analizando previamente la muestra. A partir del conocimiento de las magnitudes
estadísticas de una muestra se pueden estimar magnitudes desconocidas de una población,
como son la media y la varianza.
ANALISIS DE DATOS
Se le llama dato a cada uno de los valores obtenidos después de realizar el estudio estadístico
y variable al tipo de dato, que son una determinada característica de la población (número de
hijos, estatura, peso, color, profesión, etc.).
Se utiliza gran cantidad de datos numéricos, es útil dividir o agrupar los valores de la variable
en clases o categorías. La frecuencia de clase es el número de veces que un determinado valor
aparece en cada clase. El símbolo que define una clase se llama intervalo de clase y sus
extremos, límite inferior de clase y límite superior de clase.
La marca de clase es el punto medio del intervalo de clase y se obtiene promediando los
Límites inferior y superior de clase.
Frecuencias
Exponer la información recogida de manera inteligente:
Frecuencia Absoluta: Número de veces que aparece un valor, se representa con
donde el subíndice representa cada uno de los valores. La suma de las frecuencias absolutas
es igual al número total de datos, representado por N
f1+f2+f3+…=N
Frecuencia relativa: Es el cociente entre la frecuencia absoluta de un determinado valor
y el número total de datos. La frecuencia relativa se puede expresar en tantos por ciento
y se representa por n i .
Frecuencia Acumulada: Número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable, i
Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el
número total de datos, se representa por. Cociente entre la frecuencia absoluta acumulada y el
tamaño de la muestra Fr Para expresarla en términos de tanto por ciento se multiplica por 100
Histogramas y Polígono de Frecuencias
Representaciones gráficas de las distribuciones de frecuencias. Un histograma se obtiene
construyendo sobre cada intervalo de clase de la variable estadística continua un rectángulo
cuya área es proporcional a la frecuencia de dicho intervalo. Si los intervalos tienen la misma
anchura, las alturas de los rectángulos son proporcionales a las frecuencias de clase. El
polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de los
rectángulos del histograma.
MEDIDAS ESTADÍSTICAS
Resume la información de la muestra para poder tener un mejor conocimiento de la
población. Se distinguen los siguientes tipos de medidas estadísticas:
*De tendencia central.
* De dispersión.
* De localización.
* De la simetría.
Propiedades para una medida Estadística
*Debe definirse de manera objetiva, dos observadores distintos deben llegar al mismo
Resultado numérico
* Usar todas las observaciones y no algunas de ellas solamente, de manera que si varía
alguna observación la medida considerada debe reflejar esta variación.
*Tener un significado concreto, la interpretación debe ser inmediata y sencilla.
*Ser sencilla de calcular.
*Prestarse fácilmente al cálculo algebraico.
* Ser poco sensible a las fluctuaciones muéstrales. Esta condición es imprescindible la
Estadística Matemática y en la Teoría de Sondeos.
Medidas Estadísticas de Tendencia Central
Sirven para determinar los valores centrales o medios de la distribución:
*Media: Promedio de in valor representativo de un conjunto de datos. Los promedios se
denominan medidas de tendencia central porque suelen situarse en el centro del grupo de
datos, ordenados según su magnitud.
Media aritmética:
Media geométrica.
Media armónica
Mediana. La mediana de un conjunto de datos ordenados en orden creciente o decreciente, es
el valor central, o la media de los dos valores centrales, que divide al conjunto en dos mitades
iguales.
Moda: La moda de un conjunto de valores es el valor que ocurre con más frecuencia, es
decir, el más frecuente. Puede no existir y, en caso de existir, puede no ser única. Se trata de
la única medida de tendencia central que tiene sentido estudiar en una variable cualitativa, ya
que no precisa la realización de ningún cálculo.
Para el cálculo en distribuciones continuas se aplica la siguiente expresión:
Medidas de Dispersión
Dan una idea sobre la representatividad de las medidas centrales, saber si los valores en
general están cerca o alejados de los valores centrales, a mayor dispersión menor
representatividad.
Rango: La diferencia existente entre el valor mayor y el menor de la distribución. Fácil de
calcular.
Desviación: Diferencia entre el valor de la variable
Tipos de Desviación:
Madia: Es la media aritmética de los valores absolutos de la desviación de cada valor de la
variable con respecto a la media. Su formulación matemática es la siguiente:
Valores absolutos y Datos Agrupados
Típica o Standard
Raíz cuadrada de la varianza.
Para datos agrupados en clases y por frecuencias
Cuasi desviación
Típica
Raíz cuadrada de la cuasi varianza. La cuasi varianza se calcula dividiendo los cuadrados de
las desviaciones por N-1: Para datos agrupados en clases y por frecuencias
Coeficiente de Variación
No lleva asociada ninguna unidad, permite comparar entre dos muestras, cual es la que
presenta mayor dispersión.
Medidas de Localización
Distribuida en partes iguales, clasifica a un individuo o elemento dentro de una determinada
población o muestra. Son útiles para encontrar determinados valores importantes para llevar a
cabo una clasificación de los elementos de la muestra o población.
Clasificación
Cuartiles: Divide la población o muestra en cuatro partes iguales.
Es el valor de la variable que deja a la izquierda el 25% de la distribución.
El valor de la variable que deja a la izquierda el 50% de la distribución. Es igual a la
mediana.
El valor de la variable que deja a la izquierda el 75% de la distribución.
Cálculo de la Variable Cuantitativa
Variables cuantitativas: discretas y continuas
Discreta
Tamaño de la muestra N.
*Q1 o Q3 se calculan como la mediana de la correspondiente mitad de la muestra.
Continua
Se calculan aplicando las fórmulas:
* i−1 L es el valor del límite inferior del intervalo donde se encuentra el cuartil.
* i a es la amplitud del intervalo.
Deciles: Divide la muestra en diez partes iguales, k d . Variables cuantitativas continuas
Porcentiles: Divide en cien partes iguales, k p. Para variables cuantitativas continuas.
Medidas de Simetría
Distribución frecuente que los valores de una distribución tiendan a ser similares a ambos
lados de las medidas de centralización. Es útil para saber si los valores de la variable se
concentran en una determinada zona del recorrido de la variable, siendo la asimetría la falta
de simetría.
Asimetría negativa a la izquierda Simétrica
Asimetría positiva a la derecha Asimetría
La medida se realiza de acuerdo a dos criterios, comparando:
* La media y la moda.
*Los valores de la variable con la media.
Media y Moda Si la diferencia X − Mo es positiva, habrá asimetría positiva o a la derecha.
Si es negativa, la asimetría será negativa o a la izquierda.
Trata de una medida relativa, ya que está influida por la unidad en que se mida la variable. Se
define como:
Valores de la Variable con la Media
Compara la media de todos los valores de la variable, siendo más preciso que el anterior.
Asimetría de Fisher:
Curtosis
Mide lo puntiaguda que es una distribución, indica si la distribución es muy apuntada o poco
apuntada. El coeficiente mide el grado de apuntamiento de la distribución se calcula así:
Curtosis Negativa, Curtosis Nula, Curtosis Positiva
Planticúrtica
Mesocúrtica
Leptocúrtica
REGRESIÓN
Estudio estadístico en el que intervienen dos variables, X e Y, que pueden estar ligadas entre
sí en base a un tipo de distribución bidimensional.
* Agrupar los datos correctamente, elaborando la llamada tabla de correlación.
Cada variable asocia el intervalo, procediendo de igual forma que para el caso de una única
variable independiente cuando se agrupan los datos. Los intervalos van de menor a mayor y
se va apuntando en las casillas de cruce el número de datos que corresponda.
Representación Gráfica
Los intervalos se representarán tridimensionalmente en forma de paralelepípedos verticales
con volúmenes proporcionales a las frecuencias, ij f, de cada rectángulo, formándose el
llamado estereograma de frecuencias relativas. Uniendo los centros de cada cara superior del
estereograma se obtendrá la superficie de frecuencias que corresponde a los polígonos.
Correlación
Es el grado de influencia de una variable sobre otra. El caso más sencillo sería el de la
Correlación lineal, se da una dependencia lineal entre las dos variables.
La recta de ecuación y = a + bx, representa, de la mejor forma posible, la ley de dependencia
de la variable Y en función de X como variable independiente. Esta recta se llama recta de
regresión de Y sobre X.
Recta de Regresión Lineal
Para saber en qué medida se aproxima cada valor observado al valor teórico obtenido
Matemáticamente por la fórmula, se establece el denominado coeficiente de correlación
“r”, cuyo cuadrado es igual al cociente de la varianza debida a la influencia de X y de la
Varianza total:
DISTRIBUCIONES
Una variable aleatoria discreta asume cada uno de sus valores con una cierta
Probabilidad. Conviene representar mediante una fórmula todas las probabilidades de una
variable aleatoria X. Esta fórmula debe ser una función de la forma f(x), g(x), etc., y se
escribe f (x) = P(X = x).
Al conjunto de pares ordenados [x, f (x)] se le denomina función de cuantía o distribución de
probabilidad de X.
Una variable aleatoria continua tiene una probabilidad cero de asumir cualquiera de sus
Valores exactamente y puede tener una fórmula que será una función de los valores
numéricos de la variable continua X y se denotará por f(x). A esta función se le llama función
de densidad de X.
La mayoría de las funciones de densidad que en la práctica se usan para el análisis de datos
estadísticos son continuas. Las áreas se usarán para representar las probabilidades que tienen
valores positivos.
Tipos de Distribuciones
Binomial: Distribución discreta que tiene asociada una función de cuantía.
Si en un problema estadístico en que se manejen variables cualitativas se relaciona la
probabilidad “p” con “X”, se aplicará la distribución binomial siempre.
Poisson: Distribución discreta que expresa la probabilidad de un número k de
Eventos que ocurren en un tiempo fijo, si estos eventos ocurren con una tasa media conocida,
y son independientes del tiempo desde el último evento:
Donde:
*k es el número de ocurrencias de un evento.
* λ es un número real positivo, equivalente al número esperado de ocurrencias durante un
intervalo dado.
Gauss
Distribución de probabilidad continua. Su función de densidad expresada por una fórmula
exponencial que se representa en forma acampanada, campana de Gauss.
Características de la Curva Normal N (X, σ)
*Simétrica respecto a la ordenada de la media aritmética.
*Decrece cuando la variable se aleja de la media.
*El valor máximo de frecuencia corresponde a la media.
*Los dos puntos de inflexión corresponden a (μ+σ) y (μ-σ).
*El área comprendida entre la curva y el eje X es la unidad. Por tanto, el área bajo la curva
entre X=a y X=b, con a < b, representa la probabilidad de que X esté entre a y b: P(a < X < b)
= P (b) -P(a) =f (b) – f(a). La probabilidad de obtener un valor mayor que b será P(X >b) = 1
- P (b) = 1 - f (b).
*El 68% de los datos de la distribución normal están en el intervalo (X -σ, X +σ).
*El 95% de los datos de la distribución normal están en el intervalo(X -2σ, X +2σ).
* 99% de los datos de la distribución normal están en el intervalo(X -3σ, X +3σ).
Todo esto se observa gráficamente para el caso de la normal N (0,1):
ESTIMACIÓN DE UNA MUESTRA
Trata de la estimación de parámetros de la población, por ejemplo la media o varianza de la
población, a partir de los correspondientes estadísticos muéstrales, media o varianza de la
muestra.
Es útil hacer hipótesis de la población implicada que pueden ser ciertas o no. Generalmente,
las hipótesis estadísticas son enunciados acerca de la distribución de probabilidad de las
poblaciones.
Contraste de Hipótesis
Consiste en aceptar o rechazar, con un cierto grado de confianza, medida numéricamente, y
previa observación de muestras de una población, una hipótesis hecha sobre dicha población.
La idea es tomar una muestra de observaciones y calcular el estadístico correspondiente al
parámetro a contrastar, y si el valor es el esperado y se comprueba la hipótesis entonces se
acepta caso contrario se rechaza.
Rechazo de una Hipótesis
Hay que plantearse siempre una hipótesis, sobre una población, pero los resultados hallados
en una muestra aleatoria difieren mucho de los esperados bajo tal hipótesis, las
diferencias observadas son significativas y se debe rechazar la hipótesis.
Si se rechaza una hipótesis cuando debiera ser aceptada, se comete un error de Tipo I. Al
contrastar una hipótesis, la máxima probabilidad de correr el riesgo de rechazar una
hipótesis que debiera ser aceptada se llama nivel de significación del contraste.
Esta probabilidad sucede por α y se suele especificar antes de tomar la muestra para que los
resultados obtenidos no influyan en la elección. Si α es el nivel de significación, 1 - α es el
nivel de confianza.
En la práctica se tiene un 95% de confianza de que hemos adoptado la decisión correcta.
Se pueden realizar contrastes mediante la distribución normal
ESTADISTICA APLICADA A LA PREVENCIÓN DE RIESGOS LABORALES
Podremos sacar conclusiones válidas y adoptar decisiones razonables basadas en el análisis
de datos. Un ejemplo de estadística de accidentes y de enfermedades profesionales teniendo
en cuenta los datos.
En la prevención son las variables cuantitativas continuas las que más se emplean, para
manejar adecuadamente los valores conviene ordenarlos de menor a mayor.
Aplicaciones de la Estadística en el Campo de la Prevención Seguridad Seguimiento de la
accidentalidad, árbol de causas y efectos, fiabilidad de un sistema, etc.
Higiene
*Higiene teórica: Valores límites ambientales.
*Higiene operativa: Correlación de causas y efectos y operatividad de medidas correctoras.
*Higiene de campo: Factores determinantes (quirófanos, muestreo ambiental y ejecución de
un programa de actuación). Medicina Preventiva, Estudios epidemiológicos, etc.
Muestreo Ambiental. Esquema del Planteamiento
La valoración higiénica: En el trabajo trata de la comparación la exposición del trabajador
que lo ocupa con las exposiciones máximas permitidas.
El parámetro básico: Concentración media ponderada en el tiempo, y la medición de dicha
exposición se hace mediante procedimientos y toma de muestras y análisis.
En términos de la valoración higiénica, la duración del ciclo de trabajo y las concentraciones
medias que existen durante éste, determinarán la exposición a los contaminantes. Debido a
esto a la hora de determinar dichas concentraciones, las medidas han de cubrir un número
entero de ciclos de trabajo.
Ciclo de Trabajo: Tareas similares que se repiten de forma idéntica y sucesiva.
Duración Del Ciclo de trabajo: Concentraciones Medias Que existen durante el ciclo de
trabajo.
Tipos de Errores
Se deben tener en cuenta siempre tres tipos de error.
Primer Error
*Al analizar el puesto y se determina el ciclo de trabajo. Si el ciclo de trabajo no se estima
correctamente, las mediciones que se hagan posteriormente serán menos representativas.
*No se puede tratar estadísticamente y, dependiendo de la experiencia del higienista, podrá
minimizarse más o menos.
Segundo Error
*Es el que se imputa al método e instrumentos de medición y que puede dar lugar a
diferencias entre la concentración media medida y la que existe realmente durante el ciclo de
trabajo muestreado.
*Suele ser despreciable con respecto a los otros dos.
Tercer Error
*Variaciones aleatorias de determinados factores, corrientes de aire, etc., que no se observan
pero que pueden influir bastante en la concentración que exista en ese momento.
*La concentración ambiental media que corresponde a un ciclo de trabajo es una variable
aleatoria y no se comporta como una constante a lo largo de los sucesivos ciclos. Los posibles
errores, debido a las fluctuaciones de la concentración, pueden
controlarse haciéndose varias mediciones y tratando estadísticamente los resultados
obtenidos.
Distribución Log-Normal. Concentraciones Ambientales
La concentración medida durante un ciclo de trabajo determinado es una variable
aleatoria que sigue una distribución de probabilidad log-normal, por tanto, los logaritmos de
la variable siguen una ley normal.
Una de las condiciones importantes para que se cumpla la hipótesis de log-normal deben ser
duración aproximadamente igual.
La probabilidad de que la concentración medida esté más o menos alejada de la
concentración media real depende de si el valor de la desviación típica es mayor o menor, es
decir, de la mayor o menor los factores aleatorios que influyen sobre la concentración.
En la práctica, la variabilidad de las concentraciones medidas suele ser importante. La
Medida de dispersión se suele utilizar, en lugar de la desviación standard, el valor de la
desviación standard geométrica, GSD, cuyos valores son más fáciles de manejar, los
valores encontrados suelen hallarse en el intervalo de 1,25 a 2,5.
La desviación standard geométrica (GSD) de las concentraciones es un parámetro que indica
la variabilidad. La GSD es el antilogaritmo de la desviación standard de la distribución de los
logaritmos de las concentraciones y se define como:
Donde L σ es la desviación standard de los logaritmos naturales de las concentraciones.
ANALISIS DE ESTADISTICA
La Estadística es una de las tantas ramas de la matemática, pues se encarga de analizar y
estudiar datos, y también buscar las explicaciones.
Por otro lado, también se considera una ciencia, ya que estudia a las poblaciones de forma
específica, recopilando los diferentes datos para determinar algún problema o para darle
solución. Y luego estos datos los expresamos gráficamente según diferentes pasos estadísticos.
Los conceptos básicos de estadística son:
Población: Los elementos a los que le realizaremos en el estudio, independientemente de lo
que sea, ya sean personas, piezas de una fábrica, animales, datos de cualquier tipo.
Muestra: Es una parte que es representativa de la población. La muestra siempre será más
pequeña que la población.
Individuo: A cada uno de los alumnos del colegio, estadísticamente hablando se les llaman
individuos. Las muestras y las poblaciones están formadas por individuos.
Por otro lado, en referencia a los resultados que se obtienen en el estudio tenemos:
Valor: El valor es el resultado que puede cada uno de los datos del estudio.
Dato: Se le llama dato a cada uno de los valores obtenidos después de realizar el estudio
estadístico y variable al tipo de dato, que son una determinada característica de la población
(número de hijos, estatura, peso, color, profesión, etc.).
Muestreo: Se le llama muestreo al conjunto de datos obtenidos de la muestra.
Tipos de Frecuencia: Uno de los primeros pasos que se realizan en cualquier estudio estadístico
es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una
tabla en la que a cada valor de la variable se le asocian determinados números que representan
el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable,
etc. Estos números se denominan frecuencias: Así tenemos los siguientes tipos de frecuencia:
Frecuencia absoluta, Frecuencia relativa, Porcentaje, Frecuencia absoluta acumulada,
Frecuencia relativa acumulada, Porcentaje acumulado
Frecuencia absoluta: Es el número de veces que aparece en la muestra dicho valor de la
variable, la representaremos por ni
Frecuencia relativa: La medida que está influida por el tamaño de la muestra, al aumentar el
tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no
sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de
frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
La denotaremos por fi
Donde N = Tamaño de la muestra
Porcentaje: Es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en
términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la
frecuencia relativa por 100. La denotaremos por pi.
Frecuencia Absoluta Acumulada: En este tipo de frecuencias hay que tener en cuenta que la
variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho
sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la
variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el
de la variable y lo representaremos por Ni.
Frecuencia Relativa Acumulada: Es la frecuencia absoluta acumulada dividido por el tamaño
de la muestra, y la denotaremos por Fi
Porcentaje Acumulado: Análogamente se define el Porcentaje Acumulado y lo vamos a denotar
por Pi como la frecuencia relativa acumulada por 100
UNIVERSIDAD CATOLICA DE CUENCA
SEDE – MACAS
UNIDAD ACADEMICA DE CIENCIAS AGROPECUARIAS
FACULTAD DE AGRONOMIA
Trabajo:
Bioestadística y Diseño Experimental
Tema:
Resumen
Bases Estadísticas Aplicadas a la Prevención
Docente:
MSc: Hernán Yumbla
Alumna:
Kimberly Jaramillo
Macas – Ecuador 2019.