[go: up one dir, main page]

0% encontró este documento útil (0 votos)
25 vistas13 páginas

Resumen de Estadistica

El documento introduce conceptos básicos de estadística como estadística descriptiva e inferencial, población y muestra, variables, escalas de medición, tablas de frecuencias e histograma. También explica medidas de tendencia central como la media, mediana y moda, y medidas de dispersión como la varianza, desviación estándar y coeficiente de variación.

Cargado por

Rune El Perro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
25 vistas13 páginas

Resumen de Estadistica

El documento introduce conceptos básicos de estadística como estadística descriptiva e inferencial, población y muestra, variables, escalas de medición, tablas de frecuencias e histograma. También explica medidas de tendencia central como la media, mediana y moda, y medidas de dispersión como la varianza, desviación estándar y coeficiente de variación.

Cargado por

Rune El Perro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 13

Unidad I: Introducción

Estadística. Definición y ramas: La estadística es una ciencia, la cual


presenta un grupo de métodos utilizados para recolectar, analizar, ordenar,
presentar e interpretar datos referentes a un fenómeno estudiado o de interés.
Es una forma de medición de la certidumbre

Hay dos grandes campos dentro de la Estadística, la podemos dividir en dos


tipos:

Estadística Descriptiva: Se compone de un conjunto de técnicas y métodos


utilizados, para describir, organizar y presentar mediante tabulaciones (hacer
tablas), y gráficos, información numérica. Dentro de esta rama también se
encuentran el cálculo de las medidas estadísticas de centralidad (media,
mediana, moda) y de variabilidad o dispersión (varianza, desvío estándar,
coeficiente de variación). Describe las diversas características de un conjunto
de datos.

Estadística Inferencial: Trata de averiguar características de una población, a


partir de una muestra extraída de la misma. Y aplica en ella un conjunto de
técnicas y herramientas que son utilizados para realizar predicciones, sacar
conclusiones generales, o tomar decisiones.

Población y Muestra:

Población: Es el conjunto sobre el que se está interesado en obtener


conclusiones. Normalmente es demasiado grande para poder abarcarlo en su
totalidad.

 Parámetro: Es una cantidad numérica calculada sobre una población. Su


fin es resumir toda la información que hay en la población en unos pocos
números.

Muestra: Es un subconjunto de la población, el cual se selecciona con el


objetivo de extraer información, tenemos acceso al mismo y hacemos
observaciones o mediciones sobre este. Está formado por miembros
seleccionados, extraídos de la población, los cuales son considerados como
unidades de análisis o experimentales. Esta debería ser representativa, es
decir que abarque las características de la población.

 Estadístico: Es una cantidad numérica calculada sobre la muestra que


resume su información sobre algún aspecto. Se usa para aproximar un
parámetro, también suele llamarse estimador.
 Encuesta: es el listado de una o más características de todos los
elementos de una muestra.
Variables. Clasificación:

En estadística se denomina variable a las cualidades, propiedades,


características observables o rasgos comunes que poseen los elementos de
una población. Se estudian dos tipos de variables:

Variables cuantitativas: Son aquellas que se pueden describir mediante


números, son susceptibles de cuantificación o de medición.

 Discretas: Toma valores enteros.


 Continuas: Toma valores con decimales.

Variables cualitativas: Son aquellas cuyos valores (modalidades) no se


pueden asociar naturalmente a un número.

 Nominales: Sus valores no se pueden ordenar en escalas cualitativas y


solo puede agrupar en términos grupales.
 Ordinales: Sus valores se pueden ordenar en escalas cualitativas.

Escalas de Medición:

Escala Nominal: Es un sistema de clasificación cuyas categorías difieren entre


si cualitativamente y no en grados o en orden. Las categorías deben ser
mutuamente excluyentes, es decir, deben ser tales que ningún sujeto pueda
ser incluido en dos de ellas.

Escala Ordinal: Puede suceder que los objetos o elementos de una categoría
no solo sean distintos de los de otras categorías, sino que estén en alguna
relación con ellos, por ejemplo: más alto, más enfermo, etc. Si estas relaciones
se presentan entre los pares de categorías se tiene una escala ordinal.

Escala Intervalar: La propiedad más importante que presenta es que está por
encima de la escala ordinal y nominal. Es decir es una escala superior y
permite asignarle valores numéricos a los resultados de una variable ya que las
distancias numéricas iguales representan distancias iguales empíricas en la
variable que miden.

Escala de razón: Cuando una escala tiene todas las características de una
escala de intervalos iguales y además tiene un punto 0 verdadero en su origen,
se tiene una escala de cocientes o razones. Sin el cero absoluto, no se puede
calcular proporciones con las mediciones realizadas, es decir que en
mediciones realizadas en esta escala pueden realizarse cocientes o razones.
Con esta escala se miden variables cuantitativas discretas y continuas tales
como peso, altura, cantidad de docentes, velocidad, volumen, presión
atmosférica, etc.
Matriz de Datos:

La manera de organización que se utiliza es la conocida como matriz de datos


que ordena los datos en una planilla rectangular, posibilitando su tratamiento
en los programas informáticos

Etapas de la investigación

a) Formulación o definición del problema.


b) Diseño del experimento.
c) Recopilación de datos.
d) Clasificación, tabulación y descripción de los resultados.
e) Generalización e inferencia final.
Unidad II: Estadística Descriptiva
Tabla de Frecuencias: La tabla de frecuencias (o distribución de frecuencias)
es una tabla que muestra la distribución de los datos mediante sus frecuencias.
Se utiliza para variables cuantitativas o cualitativas ordinales.

La tabla de frecuencias es una herramienta que permite ordenar los datos de


manera que se presentan numéricamente las características de la distribución
de un conjunto de datos o muestra.

Frecuencias:

1. Frecuencia Absoluta: es la cantidad de veces que se repite el dato en la


muestra.
2. Frecuencia Absoluta Acumulada: es la suma consecutiva de los valores
de la frecuencia acumulada.
3. Frecuencia Relativa: es la Frecuencia absoluta (x) dividida en el total de
datos (x/n)
4. Frecuencia Relativa Acumulada: es la suma consecutiva de la
Frecuencia Relativa

Intervalos: Se debe agrupar a los valores en Intervalos de manera tal que


cubran todo el rango o recorrido de la variable.

Cada intervalo tendrá una un límite inferior (Li) y uno superior (Ls).

Para ello debe elegirse una amplitud de intervalo (A) que podría ser
seleccionada calculando el rango (R x) y dividiéndolo por la cantidad de
intervalos (Int.) que se desean.

Histograma: Para representar gráficamente a la información que provee una


variable cuantitativa se utiliza un histograma. El histograma es un gráfico de
frecuencias absolutas o relativas. Sobre el eje de ordenada se presentan las
frecuencias absolutas o relativas y sobre el eje de abscisa se presentan las
clases o intervalos.

Polígono de Frecuencia:

Curva de Frecuencias Acumuladas:


Medidas de Tendencia Central:

Son medidas que buscan posiciones, valores, con respecto a los que los datos
muestran tendencia a agruparse.

Media aritmética o promedio: es el promedio de los valores de una muestra.


Como es el promedio, es preciso tener en claro que primero se debe sumar
todos los valores de la muestra y dividirlo por la cantidad de valores que
presenta, en otras palabras es la suma de todos los valores dividido el tamaño
muestral.

Mediana: Es el dato central que se ve en una tabla de datos ordenada, se


considera estar en el medio de la cantidad de valores teniendo tanto por
encima como por debajo al 50% de los valores.

Moda: es el valor o los valores que mayor frecuencia tienen dentro de datos
ordenados en una tabla (tabulados). El valor que más se repite es la moda; si
hay dos valores que se repiten la misma cantidad de veces se dice que la tabla
es bimodal, ambas son modas; y si no hay ningún valor que se repita se dice
que es amodal porque no hay moda.

Medidas de dispersión o variabilidad:

Expresan cuan dispersa es una serie con respecto a una medida de


centralización o de posición.

Varianza: Es el promedio cuadrático de los desvíos de la variable con respecto


a su media. Mide el agrupamiento de los valores que conforman la variable con
respecto a su media. Mientras más cercano el valor sea a 0, va a significar que
la media representa correctamente los valores de la variable. Se elevan al
cuadrado porque hace que todos los valores sean positivos, hace que las
diferencias entre valores se destaquen. Y ya que son valores demasiados altos,
se corrige con lo que es la desviación estándar o típica.

Desviación típica o estándar: es la raíz cuadrada de la varianza de la


variable. Indica que tan disperso están los datos con respecto a la media

Coeficiente de variación: Es la relación que hay entre la desviación típica o


estándar de una muestra y su media. Es el cociente entre el desvió estándar
multiplicado por cien, y la media. Se presenta en porcentajes. Mientras más
pequeño es el coeficiente de variación, más homogéneo es el grupo de datos.
Estadísticos de posición:

Son valores de la variable que dividen a la muestra en partes de igual


porcentaje. Existen otras técnicas con las cuales puede medirse la dispersión
de un conjunto de datos. Estas medidas adicionales de dispersión son los
percentiles, los cuartiles y los deciles.

Percentiles: Separan la muestra en grupos de 1% cada uno. (son 99). Los


percentiles son 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados. El primer percentil es el valor debajo del cual se encuentra el
1% de las observaciones, y el resto están encima de éste.

Cuartiles: Agrupan 25% cada uno. Hay tres cuartiles:

1. El primer cuartil, es el valor en el cual o por debajo del cual queda un


cuarto (25%) de todos los valores de la sucesión (ordenada). En otras
palabras, es ese valor debajo del cual clasifica el 25% de las
observaciones, y sobre el cual puede encontrarse el 75% restante.
2. El segundo cuartil (50%), la mitad de las observaciones están por debajo
y la mitad por encima; en este sentido, es lo mismo que la mediana.
3. El tercer cuartil, es el valor en el cual o por debajo del cual quedan las
tres cuartas partes (75%) de los datos. Es decir, es el valor debajo del
cual está el 75% de las observaciones y encima del cual puede
encontrarse el 25% restante.

Deciles: Agrupan 10% cada uno (son 9), por lo que dividen la sucesión de
datos ordenados en diez partes porcentualmente iguales.

A todo esto hay diferentes formas de ordenar los datos en una tabla (tabular).
Se denominan series simples a los datos, los valores, ordenados
jerárquicamente sin haber demasiada frecuencia con respecto a éstos.
Generalmente son ordenados así cuando la cantidad de valores es menor o
igual a 20, si es mayor a 20, se los ordena por frecuencia y es donde se
expresa la cantidad de veces que se repute un valor. Otra forma de ordenarlos
es usando intervalos que es conveniente cuando los datos son demasiados y
pueden agrupar a los valores dentro de límites que se diferencia con otros.

Dependiendo del tipo de tabla, se grafica de manera diferente. Si es por


frecuencia se utiliza un gráfico de bastones, si es por intervalo, se utiliza un
gráfico Histograma o un polígono de frecuencias.
Unidad III: Probabilidad Básica
Probabilidades:

Propone modelos para los fenómenos aleatorios, es decir, los que se pueden
predecir con certeza, y estudia sus consecuencias lógicas ubicando valores de
posibilidades comprendido entre 0 y 1. Sirve, entonces, para sacar
conclusiones sobre la probabilidad discreta de sucesos potenciales. Estudia,
mide o determina los experimentos o fenómenos aleatorios. Por experimento
aleatorio se entiende todo aquel experimento que cuando se le repite bajo las
mismas condiciones iniciales, el resultado que se obtiene no siempre es el
mismo. Implica realizar el experimento para poder examinar los sucesos.

Hay 3 principios que el cálculo de probabilidades debe satisfacer:

 La probabilidad de que ocurra cualquier suceso abarca un rango


comprendido entre 0 y1, por ende no se puede obtener un resultado
menor a 0 ni mayor a 1 entendiendo a éste como el 100% como la
seguridad total de que algo va a suceder, y 0% como la posibilidad nula
de que algo suceda.
 Todos los posibles resultados pertenecen al espacio muestral, el cual es
el conjunto de todos los posibles resultados del experimento aleatorio.
 Cuando 2 sucesos son incompatibles la probabilidad de que se den
simultáneamente es igual a 0, por lo tanto las probabilidades de cada
suceso se suman en conjunto. Los sucesos son compatibles cuando dos
sucesos tienen como mínimo un elemento en común, en cambio son
incompatibles cuando no tienen ningún elemento en común.
 Se considera como evento o suceso aleatorio a cualquier
subconjunto del espacio muestral y representamos a los eventos
mediante ciertos símbolos relacionados con el suceso.
 En probabilidad se distingue entre experimento determinista y
aleatorio. Los deterministas son aquellos que no dependen del
azar, es decir que podemos conocer su resultado de antemano,
es predecible antes de que se realicen.
 Hay sucesos independientes y dependientes. Los primeros son
cuando la probabilidad de que suceda A no se ve afectada porque
haya sucedido o no B, uno no influye sobre el otro, y pueden
suceder de forma simultánea. En cambio, los sucesos
dependientes, si se tiene en cuenta la influencia de un evento A
en el evento B, o viceversa.

Conociendo lo siguiente se propone que una probabilidad es el resultado de la


división entre número de casos favorables sobre casos totales.

Definición clásica; Definición Frecuencial y Definición Subjetiva.


Unidad IV: Distribución de probabilidad. Discreta
La Distribución de probabilidad para una variable aleatoria discreta:

Cuando una variable aleatoria x es discreta, se puede asignar una probabilidad


a cada valor que puede tomar x y obtener la distribución de probabilidad para x.
La suma de todas las probabilidades asociadas con los valores diferentes de x
es 1.

Por ejemplo, si se mide la x=cantidad de hijos de mujeres que asisten al


hospital:

P(x=x1= 0)= 0,15

Se obtiene así, a través de la definición frecuencial la función de distribución de


una variable aleatoria discreta que asigna probabilidades a los distintos valores
que asume la variable x.

La probabilidad que x = 1 es P(x=1) = 0,25.

P(x=2)= 0,40

P(x<2)= P(x=0) + P(x=1)= 0,15 + 0,25 = 0,40

Esperanza matemática:

La Esperanza matemática es un valor promedio esperado para la variable. Es


en realidad el promedio de la población.
Por ejemplo la esperanza matemática de la variable cantidad de hijos que tiene
la siguiente distribución de probabilidad:

Es igual a:

Distribuciones probabilísticas:

Se llama distribución de probabilidad a la expresión de una función aleatoria


(discreta o continua) que tiene como dominio un conjunto de eventos
mutuamente excluyentes y por completo exhaustivos. Para construir las
distribuciones probabilísticas, que son el enlace entre la probabilidad y la
estadística, es necesario entender el concepto de variable aleatoria.

Una variable aleatoria es una regla bien definida para asignar valores
numéricos a todos los resultados probables de un experimento. Por ejemplo,
los distintos resultados que se obtienen al lanzar un dado forman una variable,
que abarcará de 1 a 6, y que no son predecibles. Y cada valor de una variable
aleatoria le corresponderá una probabilidad. Ese conjunto de todos los valores
posibles recibe el nombre de función o distribución de probabilidad de la
variable aleatoria.

En otras palabras, la variable aleatoria puede definirse como cualquier


característica medible que toma diferentes valores con probabilidades
determinadas. Toda variable aleatoria posee una distribución de probabilidad
que describe su comportamiento.

Existen dos clases de variables aleatorias, discretas y continuas.

 Una variable aleatoria discreta es una variable aleatoria que tiene valores
contables. Con una distribución de probabilidad discreta, cada valor posible de
la variable aleatoria discreta puede estar asociado con una probabilidad distinta
de cero. Por lo tanto, una distribución de probabilidad discreta suele
representarse en forma tabular. Con una distribución discreta, a diferencia de
una distribución continua, podemos calcular la probabilidad de que X sea
exactamente igual a algún valor. Este tipo de variables son las de distribución
Binomial.
 Una variable aleatoria continua es una variable aleatoria con un conjunto de
valores posibles (conocido como el rango) que es infinito y no se puede contar.
Las probabilidades de las variables aleatorias continuas (X) se definen como el
área por debajo de la curva. En otras palabras, debajo de la campana de
Gauss es el área de las probabilidades de las variables continuas.

La campana de Gauss es donde se mide una magnitud sometida a pequeñas


variaciones aleatorias entorno de la mediana.

Distribuciones:

Binomial: Produce la descripción adecuada a las probabilidades de ocurrencia


de los resultados posibles de un experimento. Aparece de forma natural al
realizar repeticiones independientes de un experimento que tenga respuesta
binaria, clasificada como “éxito” o “fracaso”. Se basa en los supuestos que las
produce la descripción adecuada a las probabilidades de ocurrencia de los
resultados posibles de un experimento observaciones son independientes entre
sí, y de que es un proceso estacionario, por lo que la probabilidad de éxito es
constante, y la de fracaso también. En base a esto se puede decir que este tipo
de distribución se lo considera dicotómico e independiente. También se trabaja
con reposición y son independientes entre si los sucesos. Toma números
enteros y son todos los números de casos posibles más 1.
Normal: También conocido como distribución de Gauss. Es capaz de adoptar
cualquier valor comprendido en el intervalo de infinitos números, por eso es la
más utilizada. Los datos que pueden salir como resultado de una distribución
normal están tipificados en tablas universales con el fin de obtener un sencillo
modo de observar los datos que permiten responder a las incógnitas acerca del
comportamiento de las variables que se saben normales. Trabaja con una
media y una desviación típica para explicar los comportamientos comunes de
las variables.

La distribución de pr muestral.

Sea pr la proporción muestral, a partir de la distribución de X puede calcularse


la distribución de pr muestral.

La probabilidad de X cantidad de éxitos, p(X=x) es igual a la probabilidad de


pr=X/n ya que solo se divide a la variable por una constante, es decir no hay
más incertidumbre agregada.
Unidad V: Distribución de Probabilidad. Continua
Distribución normal Variable aleatoria, parámetros, características.

Una de las funciones de densidad más utilizadas en aplicaciones para diversas


disciplinas es la función de densidad Normal.

La función de densidad normal, también conocida como campana de Gauss,


permite explicar el comportamiento de muchas variables continuas e incluso
algunas discretas, como por ejemplo las medidas

La distribución normal tiene una representación gráfica en forma de curva


simétrica (campana). Está completamente caracterizada por el parámetro 
(esperanza) que indica el centro de la campana, y por  2 (varianza) que define
la mayor o menor amplitud de la campana. Como la función es simétrica
respecto a, esta divide a la gráfica en partes iguales.

Gráficamente es una curva acampanada y simétrica con respecto a la media.


La distribución normal posee dos parámetros: la media  (mu) y la variancia σ2
(sigma cuadrado)

 La Media: nos dice en dónde está centrada la distribución. Si lo


modificamos, podemos "mover" la curva sobre el eje horizontal.
 Variancia: nos dice qué tan "ancha" o "angosta" es la distribución en su
base. Indica la dispersión de los datos con respecto a su valor medio.

Propiedades:

 Es simétrica con respecto a su media


 El área bajo la curva vale 1.
 Entre los valores µ ±  se posee el 68% de la información. (hay un punto
de inflexión)
 Entre los valores µ ± 2 se posee el 95% de la información.
 Entre los valores µ ± 3 se posee el 99% de la información

Las probabilidades en una distribución continua cualquiera sea, y en una


normal, solo es posible calcularla para un intervalo de la variable.
Distribución Normal Estándar z

Existe una distribución normal estándar que permite estandarizar o transformar


todas las variables normales para llevarlas a una misma escala o unidad de
medida. Es aquella distribución Normal con Media = 0 y Variancia = 1 y a esta
nueva variable aleatoria que tiene esta distribución se la simboliza con z.
Cualquier variable aleatoria x que se distribuye Normalmente con parámetros µ
y σ, se puede transformar en una variable aleatoria z que sigue la distribución
Normal Estándar con parámetros 0 y 1.

Z=(x-m)/Varianza

https://www.youtube.com/watch?v=5q5UOSGzPmw

Distribución T student:

T= (M muestral- M Poblacional)/Varianza/√n

También podría gustarte