Notas de Economía Sem 4
Notas de Economía Sem 4
Estadísticas: es una forma de obtener información de los datos recopilados. Presenta hechos en
figuras numéricas. "El objetivo es extraer información de los datos" y presentarla de manera factual
formas como una interpretación de ello.
ENCUESTAS DE SALIDA: es un método utilizado durante las elecciones para hacer predicciones a través de los votantes.
Ámbito de la estadística
Las estadísticas aumentan el campo de la visión mental así como un binocular aumenta el campo de
visión física
Simplifica masas de datos voluminosos y complejos, y los presenta en una forma y
manera que se vuelvan comprensibles.
La conversión de datos en información, la hace más adecuada para la toma de decisiones
Cuantifica y mide la incertidumbre y la variabilidad, y así ayuda en la toma de decisiones
haciendo.
Descubre patrones pasados y emergentes en los datos. Al utilizar este análisis, ayuda en
pronóstico. A veces, la estadística puede incluso sugerir posibles razones para tal
patrón.
Ayuda en la estimación y validación de suposiciones.
Los datos cuantitativos transmiten convicción y añaden fuerza y credibilidad al tema que se está
discutido. Estos se utilizan para convencer o ganar un argumento
Ayuda a los gerentes (todos los sectores de la economía) a resumir y organizar los datos
reciben a gran escala y esto ayuda aún más en la toma de decisiones.
Tipo de datos
Variable: alguna característica de una población o muestra. Por ejemplo, la nota en un examen de estadística.
por un estudiante o el precio de una acción. Representado por letras mayúsculas como X, Z, Y.
Valores - los valores de las variables son las posibles observaciones de la variable. Ejemplo: precio de
acciones (número real) que varían de 0 a 100 dólares.
Datos
3. Ordinal- parecen ser nominales, pero la diferencia es que el orden de sus valores tiene
significado. Tal como pobre, justo, bueno, muy bueno. Indica una calificación más alta. En consecuencia,
los códigos se asignan en orden ascendente.
La diferencia entre ordinal e intervalo es que las diferencias en los datos de intervalo son
consistente y significativo y en los datos ordinales se asignan códigos, por lo que es imposible
para calcular e interpretar diferencias.
La diferencia entre datos nominales y ordinales es que el orden de los valores de los
el último indica una calificación más alta.
Distribución de Frecuencia - Resumiendo los datos en una tabla, que presenta categorías y
sus cuentas.
La distribución de frecuencia relativa - enumera las categorías y la proporción con la que cada una
ocurre.
Describiendo la relación entre dos variables nominales o dos o más conjuntos de datos.
Uno de los métodos utilizados es crear una tabla de clasificación cruzada y producir una tabla
mostrando las frecuencias relativas por fila. Usando la Tabla dinámica (p. 36) sigue las instrucciones
Luego, para resumir los valores por el paso wala, ve a Valores, haz clic derecho y elige Contar.
Para convertir en porcentaje, haz clic derecho y elige % de fila.
Interpretación= Si las dos variables no están relacionadas, entonces los patrones exhibidos en la barra
los gráficos deben ser aproximadamente los mismos. Si existe alguna relación, entonces alguna barra
los gráficos diferirán de otros.
Pasos para el histograma: ve a datos, luego análisis de datos, haz clic en histograma y luego introduce en
Rango de bin y rango de salida, seleccionar etiquetas y luego salidas del gráfico.
Ancho de Intervalo de Clase = Observación Más Grande - Observación Más Pequeña / número de clases
Un histograma sesgado es aquel que tiene una cola larga que se extiende hacia la derecha o hacia la izquierda.
Series temporales - Los datos de series temporales a menudo se representan gráficamente en un gráfico de líneas, que es un
Diagrama de dispersión - Los economistas desarrollan técnicas estadísticas para describir la relación
entre variables como las tasas de desempleo y la inflación. La técnica se llama una
diagrama de dispersión. Página 69 para gráficos
Interpretar - positivo
Ogivas- Una ogiva es una curva dibujada a mano alzada que muestra la frecuencia acumulativa.
distribución. También se conoce como un polígono de frecuencia acumulativa.
La observación directa = El método más simple de obtener datos es mediante la observación directa.
Cuando los datos se recopilan de esta manera, se dice que son observacionales.
Encuestas - Uno de los métodos más familiares para recopilar datos es la encuesta, que
solicita información a las personas sobre cosas como sus ingresos, tamaño de la familia, y
opiniones sobre varios temas.
Entrevista telefónica - Una entrevista telefónica suele ser menos costosa, pero también es menos
personal y tiene una tasa de respuesta esperada más baja. A menos que el tema sea de interés, muchos
las personas se negarán a responder encuestas telefónicas.
es una muestra seleccionada de tal manera que cada posible muestra con el mismo número
de las observaciones es igualmente probable que sea elegido.
Una muestra por conglomerados es una muestra aleatoria simple de grupos o conglomerados de elementos.
El error de muestreo se refiere a las diferencias entre la muestra y la población que existen.
solo debido a las observaciones que se seleccionaron para la muestra. Muestreo
el error es un error que esperamos que ocurra cuando hacemos una afirmación sobre una población
que se basa únicamente en las observaciones contenidas en una muestra tomada de la población
La diferencia entre el verdadero (desconocido) valor de la media poblacional y su
la estimación, la media muestral, es el error de muestreo. Ex-población wala.
El error no muestral es más serio que el error muestral porque tomar un mayor
la muestra no disminuirá el tamaño, ni la posibilidad de ocurrencia, de este error. Incluso un
el censo puede (y probablemente lo hará) contener errores no de muestreo. Los errores no de muestreo son el resultado
2. Error de no respuesta - se refiere al error (o sesgo) introducido cuando las respuestas no son
obtenido de algunos miembros de la muestra.
3. Sesgo de selección: ocurre cuando el plan de muestreo es tal que algunos miembros de la
la población objetivo no puede ser seleccionada para su inclusión en la muestra.
Media poblacional - μ
La moda se define como la observación (o las observaciones) que ocurre con mayor frecuencia.
frecuencia. Tanto la estadística como el parámetro se calculan de la misma manera. Pg-93
Varianza - Cómo los datos dados varían respecto a la media aritmética del conjunto de datos. Ejemplo
la varianza denota la variación entre los datos de tu muestra y la media de tu muestra
Los datos. La muestra se extrae de la enorme población (todos los datos disponibles).
Función: VAR (Rango de Entrada)
La interpretación de la información depende de la forma del histograma y si el histograma tiene forma de campana,
usa la regla empírica.
Aproximadamente el 68% de todas las observaciones caen dentro de una desviación estándar de la media.
Aproximadamente el 95% de todas las observaciones caen dentro de dos desviaciones estándar de la
media. 3. Aproximadamente el 99.7% de todas las observaciones caen dentro de tres desviaciones estándar de
la media
Percentil
El percentil P es el valor para el cual P % son menores que ese valor y (100 - P)%
son mayores que ese valor.
Porque estas tres estadísticas dividen el conjunto de datos en cuartos, estas medidas de
La posición relativa también se llama cuartiles. El primer cuartil o cuartil inferior se etiqueta como Q1. Es
igual al percentil 25. El segundo cuartil, Q2, es igual al percentil 50,
que también es la mediana. El tercer o cuartil superior, Q3, es igual al percentil 75.
Los quintiles dividen los datos en quintos, y los deciles dividen los datos en décimos.
LP = (n + 1) P/100
=Q3-Q1
Media: El promedio aritmético del conjunto de datos dado
Mediana: El valor medio del conjunto de datos dado después de ordenarlo en orden ascendente.
orden
Moda: El valor en un conjunto de datos que tiene la frecuencia más repetitiva.
Error estándar de la media: La desviación estándar de los valores medios dados es
llamado error estándar (se calcula utilizando las medias de múltiples conjuntos de datos y
entonces calculando su desviación estándar) Cuanto más grande sea el tamaño de la muestra, más pequeña
el error estándar. ¿Qué tan lejos está tu media de muestra de la población real?
media. Medida de la precisión de la media.
Desviación estándar: Muestra cuánto se desvía o varía tus datos de la
promedio o la media de los datos. (dispersion de los datos) Baja SD significa que los datos son
agrupado alrededor de la media y altos significan que hay una alta dispersión de datos de
medio.
Varianza Muestral: Cómo varían los datos dados con respecto a la media aritmética del conjunto de datos.
La varianza muestral denota la variación entre los datos de su muestra y la media.
de tus datos de muestra. La muestra se extrae de la enorme población (entera
datos disponibles). Es el cuadrado de la desviación estándar.
-Rango: Diferencia entre el número más alto y el más bajo de un conjunto de datos dado
establecer / restar el número más pequeño del más grande.
Experimento Aleatorio Un experimento aleatorio es una acción o proceso que conduce a uno de
varios resultados posibles
Características:
El primer paso para asignar probabilidades es elaborar una lista de los resultados. Los enumerados
los resultados deben ser exhaustivos, lo que significa que todos los resultados posibles deben ser
incluidos. Además, los resultados deben ser mutuamente excluyentes, lo que significa que ninguno
dos resultados pueden ocurrir al mismo tiempo.
Espacio Muestral: Un espacio muestral de un experimento aleatorio es una lista de todos los posibles
resultados del experimento. Los resultados deben ser exhaustivos y mutuamente excluyentes.
Requisitos:
2. La suma de las probabilidades de todos los resultados en un espacio muestral debe ser 1.
3 enfoques para asignar probabilidades:
Interpretando la probabilidad: 6-1d Pg 158, ej. primero interpreta de cualquier manera usando relativo
enfoque de frecuencia, luego enfoque subjetivo.
Evento: Un evento es una colección o conjunto de uno o más eventos simples en un espacio muestral.
Un resultado individual de un espacio muestral se llama un evento simple. Todos los demás eventos son
compuesto de eventos simples en un espacio muestral.
La intersección de los eventos A y B es el evento que ocurre cuando tanto A como B ocurren. Ello
se denota como A y B. La probabilidad de la intersección se llama la probabilidad conjunta.
(Espacio central en el diagrama de Venn).
Las probabilidades marginales, calculadas al sumar a lo largo de las filas o hacia abajo en las columnas, son tan
Las probabilidades condicionales, (para saber cómo se relacionan dos eventos) solo si la condición
ocurre entonces solo se presenta esta probabilidad - probabilidad de un evento dado la ocurrencia
de otro evento relacionado.
| = Condición (significa, dado) para la probabilidad condicional
∪=o
Un experimento aleatorio es cuando conoces los resultados de antemano, pero los resultados exactos
son desconocidos.
Una variable aleatoria discreta es aquella que puede tomar un número contable de valores. (altura, puntuaciones, etc.)
Una rv continua es aquella cuyos valores son incontables. (tiempo, combustible consumido, etc.)
Una distribución de probabilidad es una tabla, fórmula o gráfico que describe los valores de un
variable aleatoria y la probabilidad asociada con estos valores.
Requisitos para una Distribución de una Variable Aleatoria Discreta
E(x)=sigma x P(X=x)
Es la suma de los valores que toma una variable aleatoria y está asociada con
probabilidades.
DISTRIBUCIÓN BINOMIAL
Probabilidad de éxito - p
Probabilidad de fallo = 1 - p
los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta al
resultados de cualquier otro juicio
los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta al
resultados de cualquier otro juicio
P(x)= n! / x! (n-x)!
BINOM.DIST
DISTRIBUCIÓN DE POISSON
DISTRIBUCIÓN NORMAL
Basado en variables aleatorias continuas, los valores están dentro de un intervalo particular.
NORM.S.DIST(Z, Verdadero)
NORM.INV
NORM.S.INV
Unidad 10 Estadística Inferencial
Error en la estimación: un error cometido al usar la ecuación de una línea de regresión para
estimar los valores de la variable dependiente a partir de los de la variable independiente.
Tamaño de la muestra
Distribución Estadística: Distribución de Muestreo -
123456
Media poblacional -
μ = ΣxP(x)
= 3.5
Varianza poblacional
2
σ2 =Σ ( − µ) P(x)
= 2.92
σ = σ2
= 2. 92
= 1.71
Hay dos errores posibles. Un error de tipo I ocurre cuando rechazamos una nula verdadera.
hipótesis. Un error de Tipo II se define como no rechazar una hipótesis nula falsa. En el
En un juicio penal, se comete un error tipo I cuando se condena injustamente a una persona inocente.
El error de Tipo II ocurre cuando un acusado culpable es absuelto. La probabilidad de un Tipo I
el error se denota por α que también se llama el nivel de significancia (alfa). La probabilidad
de un error de tipo II se denota por β (letra griega beta). Las probabilidades de error α y β son
relacionados inversamente, lo que significa que cualquier intento de reducir uno aumentará el otro.
Conceptos Críticos de HT
El objetivo del proceso es determinar si hay suficiente evidencia para inferir que
la hipótesis alternativa es verdadera.
Se pueden cometer dos errores posibles en cualquier prueba. Un error de Tipo I ocurre cuando rechazamos un
la hipótesis nula verdadera, y un error tipo II ocurre cuando no rechazamos una hipótesis nula falsa
hipótesis.
P(Error Tipo I) = α
Pasos involucrados:
Zcal => ya sea usando la distribución normal (NORMDIST) o memorizando la tabla anterior.
X - u = **
sd/sqrt(n) = ***
Unidad 12 Correlación
Dos variables = correlación simple, Parcial = más de dos variables pero estudiando solo 2
después de hacer todos los demás constantes, Múltiple = Estudiar múltiples variables simultáneamente.
Grado de correlación:
Haga clic en datos > análisis de datos > seleccione correlación > rango de entrada: ambas columnas > menú desplegable
- rango de entrada = (A1:B10)
Función
( . ) Σ( − )( − )
δ = σ ,σ
oδ = 2 2
( − ) − ( − )
2
Desviación estándarσ = ( − )
Covarianza
Coeficiente de correlación por rangos de Spearman:
= ℎ
Unidad. 13 - 16 REGRESIÓN
Regresión: Estudio de la relación entre la variable independiente y la dependiente
variable. La regresión ayuda a predecir posibles valores de variables dependientes basadas en
sobre los independientes. La regresión nos ayuda a predecir cómo actuarán las variables dependientes si
el independiente aumenta o disminuye.
El análisis de regresión se utiliza para predecir el valor de una variable en función de otra.
variable. Desarrolla una ecuación matemática o un modelo que describe la relación
entre la variable dependiente (variable a ser pronosticada) y la variable independiente
(creído por el practicante)
Siempre inserta una línea de tendencia en un diagrama de dispersión, además añade la ecuación lineal y R
valor cuadrado.
Pasos -
El modelo de línea recta con una variable independiente. Este modelo se llama el
modelo lineal de primer orden— a veces llamado el modelo de regresión lineal simple.
Modelo Lineal de Primer Orden
y = β0 + β1x + ε
Dónde,
y = variable dependiente
x = variable independiente β
0 = intersección y
β1 = pendiente de la línea (definida como elevación / ejecución)
ε = variable de error
y = a + bx
Error variable - abarca todas las variables, medibles y no medibles, que son
no forma parte del modelo.
Salida residual - Los residuales son observaciones de la variable de error. Las desviaciones
entre los puntos de datos reales y la línea se llaman residuales, denotados como ei; es decir, ei =
yi − y^i
Función en Excel :-
1. Haga clic, Datos, Análisis de Datos y Regresión
2. Especifique el rango de entrada Y (A1:A101) y el rango de entrada X (B1:B101).
3. Dibujar diagrama de dispersión - seleccionar para graficar la línea de ajuste
Interpretación de la regresión
Tabla ANOVA - es el Análisis de Varianza (ANOVA) que muestra las fuentes de variación en
el modelo de regresión.
Grados de libertad- gl
F: La estadística F es una razón de los valores de cuadrados medios y prueba la significancia general
del modelo de regresión.
la correlación no puede predecir cosas. la correlación es una relación lineal. la correlación puede ser
entre cualquier cosa menos que la regresión no puede tener lugar entre cosas no relacionadas.
Covarianza: Una medida de variación en dos variables juntas utilizando sus medias.
Establece relaciones positivas o negativas entre dos variables.
Cuando la covarianza adquiere una escala definida, se llama correlación. También limita el rango de
Los datos. La covarianza da dirección y la relación también da fuerza. Covarianza en unidades.
Series de tiempo - Los datos de series de tiempo a menudo se representan gráficamente en un gráfico de líneas, que es un
- Cualquier variable que se mide a lo largo del tiempo en orden secuencial se llama serie temporal
El análisis de series temporales ayuda a detectar patrones que nos permitirán prever.
valores futuros de la serie temporal.
- Cualquier dato que esté indexado con respecto al tiempo es una serie temporal.
Los economistas de la industria de la vivienda deben prever las tasas de interés hipotecarias, la demanda de
vivienda y el costo de los materiales de construcción.
4. Las universidades y colegios a menudo intentan predecir el número de estudiantes que estarán
solicitando la aceptación en instituciones de educación superior
1. Tendencia a largo plazo - Una tendencia (también conocida como tendencia secular) es una tendencia a largo plazo, relativamente
patrón o dirección suave exhibida por una serie. Su duración es de más de 1 año. [TSCI]
Por ejemplo, la población de los Estados Unidos mostró una tendencia relativamente estable
crecimiento de 157 millones en 1952 a 314 millones en 2012.
2. Variación cíclica: es un patrón en forma de onda que describe una tendencia a largo plazo que es
generalmente aparente a lo largo de varios años, resultando en un efecto cíclico. Por definición, es
tiene una duración de más de 1 año. Sin embargo, los patrones cíclicos que son consistentes y
predecibles son bastante raros. Para fines prácticos, ignoraremos este tipo de variación
3.Variación estacional- se refiere a ciclos que ocurren en periodos calendarios repetitivos cortos
y, por definición, tienen una duración de menos de 1 año. Causado por irregular y
cambios impredecibles y ningún otro componente.
Por ejemplo, el término variación estacional puede referirse a las cuatro estaciones tradicionales o a
patrones sistemáticos que ocurren durante un mes, una semana o incluso un día. La demanda de
los restaurantes presentan una variación "estacional" a lo largo del día.
Una media móvil para un período de tiempo es la media aritmética de los valores en ese tiempo
período y aquellos cercanos a él. Es una serie de promedios, calculados a partir de datos históricos.
Cálculo en Excel
En Excel: Sumar y dividir por 3 para el promedio móvil de tres trimestres, primer y último valor no incluidos.
incluido
En Excel: Sumar y dividir por 5 para el promedio móvil de cinco trimestres, los dos primeros y los dos últimos
valores no incluidos