[go: up one dir, main page]

0% encontró este documento útil (0 votos)
14 vistas25 páginas

Notas de Economía Sem 4

El documento proporciona una visión general de los conceptos clave en estadística, incluidos la estadística descriptiva, parámetros, muestras, poblaciones e inferencia estadística. Discute varios tipos de datos y cómo presentar datos visualmente a través de gráficos y tablas. El documento también abarca temas como los métodos de recolección de datos, muestreo, medidas de tendencia central y medidas de dispersión.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
14 vistas25 páginas

Notas de Economía Sem 4

El documento proporciona una visión general de los conceptos clave en estadística, incluidos la estadística descriptiva, parámetros, muestras, poblaciones e inferencia estadística. Discute varios tipos de datos y cómo presentar datos visualmente a través de gráficos y tablas. El documento también abarca temas como los métodos de recolección de datos, muestreo, medidas de tendencia central y medidas de dispersión.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 25

Notas de Economía - Sem 4 (Hecho por Arya Naga solo con notas de Sakshi)

Unidad 1. Introducción a la estadística

Estadísticas: es una forma de obtener información de los datos recopilados. Presenta hechos en
figuras numéricas. "El objetivo es extraer información de los datos" y presentarla de manera factual
formas como una interpretación de ello.

-Las estadísticas descriptivas- se ocupan de organizar, resumir y presentar datos


de una manera conveniente e informativa. (Puede ser de población, p. ej.-promedio o
Significa) Transmite información de dos maneras /tipos -

a) Técnicas gráficas - método fácil para extraer información de lo presentado


datos. Ej. Gráfico de barras, gráfico de pastel, etc.

b) Técnica numérica - utiliza técnicas numéricas para resumir datos para


interpretaciones adicionales. Ej. Cálculo de media, Desviación estándar, etc.

-Parámetro- La medida descriptiva de una población se llama parámetro.


-Histograma- muestra el número de observaciones distribuidas en un rango particular.
La muestra es un conjunto de datos extraídos de la población estudiada. Una descriptiva
la medida de una muestra se llama estadística. Las estadísticas de la muestra se utilizan para hacer
inferencias sobre toda la población.
Población - el conjunto completo de observaciones bajo estudio / grupo de elementos de
interés, generalmente muy grande.
-Inferencia Estadística- proceso de hacer una estimación, predicción o decisión
sobre una población basada en datos de muestra. Mide lo siguiente:

Estadísticas inferenciales - métodos utilizados para sacar conclusiones o inferencias sobre


características de las poblaciones basadas en datos de muestra.

Nivel de confianza: la proporción de veces que un procedimiento de estimación será


correcto.

El nivel de significancia mide con qué frecuencia la conclusión será incorrecta.

ENCUESTAS DE SALIDA: es un método utilizado durante las elecciones para hacer predicciones a través de los votantes.

respuesta cuando salen de la urna electoral (solo se utiliza para elecciones)

Ámbito de la estadística

Las estadísticas aumentan el campo de la visión mental así como un binocular aumenta el campo de
visión física
Simplifica masas de datos voluminosos y complejos, y los presenta en una forma y
manera que se vuelvan comprensibles.
La conversión de datos en información, la hace más adecuada para la toma de decisiones
Cuantifica y mide la incertidumbre y la variabilidad, y así ayuda en la toma de decisiones
haciendo.
Descubre patrones pasados y emergentes en los datos. Al utilizar este análisis, ayuda en
pronóstico. A veces, la estadística puede incluso sugerir posibles razones para tal
patrón.
Ayuda en la estimación y validación de suposiciones.
Los datos cuantitativos transmiten convicción y añaden fuerza y credibilidad al tema que se está
discutido. Estos se utilizan para convencer o ganar un argumento

¿Cómo ayuda a los demás?

Ayuda a los gerentes (todos los sectores de la economía) a resumir y organizar los datos
reciben a gran escala y esto ayuda aún más en la toma de decisiones.

La toma de decisiones a menudo se realiza con la ayuda de estadísticas descriptivas. Estas


Los métodos son directos. También ayuda en la planificación económica.

La mayoría de los estudiantes de gestión, negocios y economía se encontrarán con numerosos


oportunidades para hacer un uso valioso de técnicas descriptivas gráficas y numéricas
al preparar informes y presentaciones en el lugar de trabajo.

Unidad 2. Clasificación y Tipos de datos

Tipo de datos

Algunos términos importantes:

Variable: alguna característica de una población o muestra. Por ejemplo, la nota en un examen de estadística.
por un estudiante o el precio de una acción. Representado por letras mayúsculas como X, Z, Y.

Valores - los valores de las variables son las posibles observaciones de la variable. Ejemplo: precio de
acciones (número real) que varían de 0 a 100 dólares.

Datos

Tres tipos de datos

1. Intervalo: son números reales como alturas, pesos, ingresos y distancias.


2. Nominal: valores que son categorías. Como el estado civil de las personas. Códigos
se asignan a estos valores no numéricos. Posteriormente se categoriza en cualitativo y
Categórico.

3. Ordinal- parecen ser nominales, pero la diferencia es que el orden de sus valores tiene
significado. Tal como pobre, justo, bueno, muy bueno. Indica una calificación más alta. En consecuencia,
los códigos se asignan en orden ascendente.

La diferencia entre ordinal e intervalo es que las diferencias en los datos de intervalo son
consistente y significativo y en los datos ordinales se asignan códigos, por lo que es imposible
para calcular e interpretar diferencias.

La diferencia entre datos nominales y ordinales es que el orden de los valores de los
el último indica una calificación más alta.

* En datos nominales y ordinales no se pueden realizar cálculos estadísticos descriptivos.


solo excepto la Frecuencia

* En los datos ordinales solo se puede asignar y luego calcular el ranking.

Describiendo un conjunto de datos nominales.

Distribución de Frecuencia - Resumiendo los datos en una tabla, que presenta categorías y
sus cuentas.

La distribución de frecuencia relativa - enumera las categorías y la proporción con la que cada una
ocurre.

CONTAR.SI (Rango de entrada, Criterio)

Por ejemplo, Contar.si (X1:X250,1)

Describiendo la relación entre dos variables nominales o dos o más conjuntos de datos.

Uno de los métodos utilizados es crear una tabla de clasificación cruzada y producir una tabla
mostrando las frecuencias relativas por fila. Usando la Tabla dinámica (p. 36) sigue las instrucciones
Luego, para resumir los valores por el paso wala, ve a Valores, haz clic derecho y elige Contar.
Para convertir en porcentaje, haz clic derecho y elige % de fila.
Interpretación= Si las dos variables no están relacionadas, entonces los patrones exhibidos en la barra
los gráficos deben ser aproximadamente los mismos. Si existe alguna relación, entonces alguna barra
los gráficos diferirán de otros.

Unidad 3. Presentación y Visualización de Datos

Técnicas gráficas para describir datos de intervalo

La distribución de frecuencias proporciona información sobre cómo se distribuyen los números.


la información se comprende y se transmite más fácilmente al dibujar una imagen o un gráfico.
El gráfico se llama histograma. Un histograma se crea dibujando rectángulos cuyos
las bases son los intervalos y cuyas alturas son las frecuencias.

Pasos para el histograma: ve a datos, luego análisis de datos, haz clic en histograma y luego introduce en
Rango de bin y rango de salida, seleccionar etiquetas y luego salidas del gráfico.

Ancho de Intervalo de Clase = Observación Más Grande - Observación Más Pequeña / número de clases

Formas del histograma

Simetría: los dos lados son idénticos en forma y tamaño.

Sesgado positivamente - más hacia la izquierda

Sesgo negativo - hacia la derecha más

Un histograma sesgado es aquel que tiene una cola larga que se extiende hacia la derecha o hacia la izquierda.

Unimodal - un solo pico Bimodal-Dos picos

Series temporales - Los datos de series temporales a menudo se representan gráficamente en un gráfico de líneas, que es un

gráfica de la variable a lo largo del tiempo. Se crea al trazar el valor de la variable en el


eje vertical y los períodos de tiempo en el eje horizontal.

Diagrama de dispersión - Los economistas desarrollan técnicas estadísticas para describir la relación
entre variables como las tasas de desempleo y la inflación. La técnica se llama una
diagrama de dispersión. Página 69 para gráficos
Interpretar - positivo

Negativo, sin relación, no lineal.

Ogivas- Una ogiva es una curva dibujada a mano alzada que muestra la frecuencia acumulativa.
distribución. También se conoce como un polígono de frecuencia acumulativa.

Unidad 4. Recopilación de datos y muestreo

La observación directa = El método más simple de obtener datos es mediante la observación directa.
Cuando los datos se recopilan de esta manera, se dice que son observacionales.

Datos experimentales: producidos a través de experimentos. Y son más caros.

Encuestas - Uno de los métodos más familiares para recopilar datos es la encuesta, que
solicita información a las personas sobre cosas como sus ingresos, tamaño de la familia, y
opiniones sobre varios temas.

Entrevista personal - implica que un entrevistador solicite información de un encuestado mediante


hacer preguntas preparadas. Una entrevista personal tiene la ventaja de tener un mayor
tasa de respuesta esperada que otros métodos de recolección de datos.

Entrevista telefónica - Una entrevista telefónica suele ser menos costosa, pero también es menos
personal y tiene una tasa de respuesta esperada más baja. A menos que el tema sea de interés, muchos
las personas se negarán a responder encuestas telefónicas.

Muestreo Aleatorio Simple

es una muestra seleccionada de tal manera que cada posible muestra con el mismo número
de las observaciones es igualmente probable que sea elegido.

Una muestra aleatoria estratificada se obtiene separando la población en grupos mutuamente


conjuntos exclusivos, o estratos, y luego extrayendo muestras aleatorias simples de cada estrato.
(Creando categorías)

Una muestra por conglomerados es una muestra aleatoria simple de grupos o conglomerados de elementos.

El error de muestreo se refiere a las diferencias entre la muestra y la población que existen.
solo debido a las observaciones que se seleccionaron para la muestra. Muestreo
el error es un error que esperamos que ocurra cuando hacemos una afirmación sobre una población
que se basa únicamente en las observaciones contenidas en una muestra tomada de la población
La diferencia entre el verdadero (desconocido) valor de la media poblacional y su
la estimación, la media muestral, es el error de muestreo. Ex-población wala.

El error no muestral es más serio que el error muestral porque tomar un mayor
la muestra no disminuirá el tamaño, ni la posibilidad de ocurrencia, de este error. Incluso un
el censo puede (y probablemente lo hará) contener errores no de muestreo. Los errores no de muestreo son el resultado

de errores cometidos en la adquisición de datos o de las observaciones de la muestra siendo


seleccionado incorrectamente.

1. Errores en la adquisición de datos: surgen de la grabación de respuestas incorrectas.

2. Error de no respuesta - se refiere al error (o sesgo) introducido cuando las respuestas no son
obtenido de algunos miembros de la muestra.

3. Sesgo de selección: ocurre cuando el plan de muestreo es tal que algunos miembros de la
la población objetivo no puede ser seleccionada para su inclusión en la muestra.

Unidad 5 Medidas de Tendencia Central y Dispersión

Medidas de ubicación central

La media aritmética = la media se calcula sumando las observaciones y dividiendo por el


número de observaciones.

Media poblacional - μ

Función = PROMEDIO ([Rango de entrada]) o Análisis descriptivo.

Mediana= La mediana se calcula colocando todas las observaciones en orden (ascendente o


La observación que queda en el medio es la mediana.

Función = MEDIANA (Rango de entrada)

La moda se define como la observación (o las observaciones) que ocurre con mayor frecuencia.
frecuencia. Tanto la estadística como el parámetro se calculan de la misma manera. Pg-93

Rango - Mayor obv - Menor obv

Varianza - Cómo los datos dados varían respecto a la media aritmética del conjunto de datos. Ejemplo
la varianza denota la variación entre los datos de tu muestra y la media de tu muestra
Los datos. La muestra se extrae de la enorme población (todos los datos disponibles).
Función: VAR (Rango de Entrada)

Población Varx y Muestra Varx pg. 97

LA VARIANCIA NO PUEDE SER NEGATIVA PORQUE ESTÁ AL CUADRADO, LO QUE ELIMINA


TODAS LAS POSIBILIDADES DE SER NEGATIVO.

Desviación estándar: Muestra cuánto se desvía o varía tus datos de la media.


la media de los datos. Baja desviación estándar significa que los datos están agrupados alrededor de la media y alta significa
hay una alta dispersión de los datos con respecto a la media.

La interpretación de la información depende de la forma del histograma y si el histograma tiene forma de campana,
usa la regla empírica.

Aproximadamente el 68% de todas las observaciones caen dentro de una desviación estándar de la media.

Aproximadamente el 95% de todas las observaciones caen dentro de dos desviaciones estándar de la
media. 3. Aproximadamente el 99.7% de todas las observaciones caen dentro de tres desviaciones estándar de
la media

El coeficiente de variación de un conjunto de observaciones es la desviación estándar de la


observaciones divididas por su media: Coeficiente de variación de la población: CV = σ/μ

Muestra de coeficiente de variación: cv = s/x

Percentil

El percentil P es el valor para el cual P % son menores que ese valor y (100 - P)%
son mayores que ese valor.

Porque estas tres estadísticas dividen el conjunto de datos en cuartos, estas medidas de
La posición relativa también se llama cuartiles. El primer cuartil o cuartil inferior se etiqueta como Q1. Es
igual al percentil 25. El segundo cuartil, Q2, es igual al percentil 50,
que también es la mediana. El tercer o cuartil superior, Q3, es igual al percentil 75.

Los quintiles dividen los datos en quintos, y los deciles dividen los datos en décimos.

LP = (n + 1) P/100

El rango intercuartílico mide la dispersión del 50% central de las observaciones.


Valores grandes de esta estadística significan que el primer y el tercer cuartil están alejados.
indicando un alto nivel de variabilidad.

=Q3-Q1
Media: El promedio aritmético del conjunto de datos dado
Mediana: El valor medio del conjunto de datos dado después de ordenarlo en orden ascendente.
orden
Moda: El valor en un conjunto de datos que tiene la frecuencia más repetitiva.
Error estándar de la media: La desviación estándar de los valores medios dados es
llamado error estándar (se calcula utilizando las medias de múltiples conjuntos de datos y
entonces calculando su desviación estándar) Cuanto más grande sea el tamaño de la muestra, más pequeña
el error estándar. ¿Qué tan lejos está tu media de muestra de la población real?
media. Medida de la precisión de la media.
Desviación estándar: Muestra cuánto se desvía o varía tus datos de la
promedio o la media de los datos. (dispersion de los datos) Baja SD significa que los datos son
agrupado alrededor de la media y altos significan que hay una alta dispersión de datos de
medio.
Varianza Muestral: Cómo varían los datos dados con respecto a la media aritmética del conjunto de datos.
La varianza muestral denota la variación entre los datos de su muestra y la media.
de tus datos de muestra. La muestra se extrae de la enorme población (entera
datos disponibles). Es el cuadrado de la desviación estándar.
-Rango: Diferencia entre el número más alto y el más bajo de un conjunto de datos dado
establecer / restar el número más pequeño del más grande.

Unidad. 6-7 Probabilidad 1

Experimento Aleatorio Un experimento aleatorio es una acción o proceso que conduce a uno de
varios resultados posibles

Características:

El primer paso para asignar probabilidades es elaborar una lista de los resultados. Los enumerados
los resultados deben ser exhaustivos, lo que significa que todos los resultados posibles deben ser
incluidos. Además, los resultados deben ser mutuamente excluyentes, lo que significa que ninguno
dos resultados pueden ocurrir al mismo tiempo.

Espacio Muestral: Un espacio muestral de un experimento aleatorio es una lista de todos los posibles
resultados del experimento. Los resultados deben ser exhaustivos y mutuamente excluyentes.

Requisitos:

1. La probabilidad de cualquier resultado debe estar entre 0 y 1; es decir, 0 ≤ P(Oi) ≤ 1

2. La suma de las probabilidades de todos los resultados en un espacio muestral debe ser 1.
3 enfoques para asignar probabilidades:

1. Enfoque Clásico - probabilidades iguales asignadas según el número de


resultados posibles. Juego de azar (adivinar)
2. Enfoque de frecuencia relativa - define la probabilidad como la frecuencia relativa a largo plazo
con el cual ocurre un resultado. (Suponga que hay un número infinito de
observaciones)

Fórmula: P(a) = n(a)/espacio muestral (número total de observaciones en el espacio muestral)

3. Enfoque subjetivo - define la probabilidad como el grado de creencia que tenemos en


la ocurrencia de un evento.

Interpretando la probabilidad: 6-1d Pg 158, ej. primero interpreta de cualquier manera usando relativo
enfoque de frecuencia, luego enfoque subjetivo.

Evento: Un evento es una colección o conjunto de uno o más eventos simples en un espacio muestral.

Un resultado individual de un espacio muestral se llama un evento simple. Todos los demás eventos son
compuesto de eventos simples en un espacio muestral.

La probabilidad de un evento es la suma de las probabilidades de los eventos simples que


constituir el evento.

Intersección de los eventos A y B

La intersección de los eventos A y B es el evento que ocurre cuando tanto A como B ocurren. Ello
se denota como A y B. La probabilidad de la intersección se llama la probabilidad conjunta.
(Espacio central en el diagrama de Venn).

Las probabilidades marginales, calculadas al sumar a lo largo de las filas o hacia abajo en las columnas, son tan

llamados así porque se calculan en los márgenes de la tabla.

Las probabilidades condicionales, (para saber cómo se relacionan dos eventos) solo si la condición
ocurre entonces solo se presenta esta probabilidad - probabilidad de un evento dado la ocurrencia
de otro evento relacionado.
| = Condición (significa, dado) para la probabilidad condicional

∩ = y = intersección (u invertido) para probabilidad conjunta

∪=o

Independencia: Dos eventos A y B son independientes si y solo si la probabilidad conjunta es


multiplicación de la probabilidad marginal de P(A) y P(B); P(A n B) = P(A) * P(B). Esto es
también el teorema de multiplicación. - probabilidad conjunta de dos eventos.

Dos eventos A y B se dicen mutuamente excluyentes o disjuntos si no tienen ninguna


resultados comunes, P(A y B) = 0; P(A n B) = 0

Recíprocos: cuando la suma de las probabilidades de ambos es 1

La suma es 1: cuando el espacio muestral es el mismo (mismo denominador)

Teorema de la suma: Si P(A) y P(B) no son eventos mutuamente excluyentes, entonces:

P(A u B) => P(A) + P(B) - P(A n B)

Regla de adición para eventos mutuamente excluyentes P(A u B) = P(A) + P(B)

Es el teorema de adición, siempre que la pregunta tenga 'O'

Es el teorema de multiplicación, cuando la pregunta tiene 'y'


Teorema de Bayes: Dado por Thomas Bayes, describe elprobabilidadde unevento, basado
sobre el conocimiento previo de las condiciones que podrían estar relacionadas con el evento.

Regla del Complemento:

El complemento del evento A es el evento que ocurre cuando el evento A no ocurre.


el complemento del evento A se denota como AC. La regla del complemento definida aquí se deriva
de que la probabilidad de un evento y la probabilidad del evento
el complemento debe sumar 1.

Unidad. 8 - 9. Variable Aleatoria y Distribución de Probabilidad 1

Variable Aleatoria - función o regla que asigna números reales al resultado de un


experimento aleatorio.

Un experimento aleatorio es cuando conoces los resultados de antemano, pero los resultados exactos
son desconocidos.

Una variable aleatoria discreta es aquella que puede tomar un número contable de valores. (altura, puntuaciones, etc.)

Una rv continua es aquella cuyos valores son incontables. (tiempo, combustible consumido, etc.)

Una distribución de probabilidad es una tabla, fórmula o gráfico que describe los valores de un
variable aleatoria y la probabilidad asociada con estos valores.
Requisitos para una Distribución de una Variable Aleatoria Discreta

1. 0 ≤ P(x) ≤ 1 para todo x está entre 0 y 1

2. todo-x P(x) = 1 la suma de todas las probabilidades = 1

Media poblacional (neu)


(Refiérase al cuaderno)

La desviación estándar = raíz cuadrada de la varianza.

E(x)=sigma x P(X=x)

Es la suma de los valores que toma una variable aleatoria y está asociada con
probabilidades.

DISTRIBUCIÓN BINOMIAL

Número fijo de ensayos

Solo tiene dos resultados: éxito y fracaso

Probabilidad de éxito - p

Probabilidad de fallo = 1 - p
los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta al
resultados de cualquier otro juicio

Prueba de Bernoulli = si solo hay dos resultados, éxito y fracaso, Probabilidad de


éxito

Probabilidad de fallo= 1-p

los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta al
resultados de cualquier otro juicio

P(x)= n! / x! (n-x)!

BINOM.DIST

DISTRIBUCIÓN DE POISSON

Si queremos averiguar la probabilidad de éxitos en cada intervalo de tiempo o espacio, debemos


usar distribución de Poisson.

Función=POISSON.DIST(x, mu, t/f)

P(x) = e−μμx/ x! y sustituyendo x = 0

DISTRIBUCIÓN NORMAL

Basado en variables aleatorias continuas, los valores están dentro de un intervalo particular.

Alturas, Pesos y distancia cubierta.

Tiene forma de campana y es simétrico alrededor de la media.

NORM.DIST(x, mu, SD, verdadero)

NORM.S.DIST(Z, Verdadero)

NORM.INV

NORM.S.INV
Unidad 10 Estadística Inferencial

Estadísticas inferenciales: métodos utilizados para sacar conclusiones o inferencias sobre


características de las poblaciones basadas en datos de muestra.

Estimaciones Puntuales: Estimador Puntual - Un estimador puntual hace inferencias sobre un


población al estimar el valor de un parámetro desconocido utilizando un solo valor o
punto.

Estimaciones de Intervalo: Estimador de Intervalo - un estimador de intervalo saca inferencias sobre un


población al estimar el valor de un parámetro desconocido utilizando un intervalo

Intervalos de Confianza: se refiere a la probabilidad de que un parámetro poblacional caerá


entre un conjunto de valores durante una cierta proporción de tiempos. Los analistas a menudo utilizan la confianza
intervalos que contienen el 95% o el 99% de las observaciones esperadas.

Error en la estimación: un error cometido al usar la ecuación de una línea de regresión para
estimar los valores de la variable dependiente a partir de los de la variable independiente.

Tamaño de la muestra
Distribución Estadística: Distribución de Muestreo -

123456

P(x): 1/6 1/6 1/6 1/6 1/6 1/6

Media poblacional -

μ = ΣxP(x)

= 1(1/6) + 2(1/6) + 3(1/6) + 4(1/6) + 5(1/6) + 6(1/6)

= 3.5

Varianza poblacional

2
σ2 =Σ ( − µ) P(x)

= (1 − 3.5)2(1/6) + (2 − 3.5)2(1/6) + (3 − 3.5)2(1/6) + (4 − 3.5)2(1/6) + (5 − 3.5)2(1/6) +


(6 − 3.5)²(1/6)

= 2.92

Desviación estándar de la población

σ = σ2

= 2. 92

= 1.71

Σ = a = sigma, suma de todas las observaciones


Unidad 11 Pruebas de Hipótesis

El propósito de este tipo de inferencia es determinar si hay suficientes estadísticas


existe evidencia que nos permite concluir que una creencia o hipótesis sobre un parámetro
está respaldado por los datos. (o no)

La hipótesis nula (negativa sobre el estudio/ ausencia de fenómenos)

La hipótesis alterna / hipótesis de investigación (positiva sobre el estudio / lo que nosotros


quiero saber/ presencia de fenómenos

//formulado como no rechazar la hipótesis nula en favor de la alternativa.

Hay dos errores posibles. Un error de tipo I ocurre cuando rechazamos una nula verdadera.
hipótesis. Un error de Tipo II se define como no rechazar una hipótesis nula falsa. En el
En un juicio penal, se comete un error tipo I cuando se condena injustamente a una persona inocente.
El error de Tipo II ocurre cuando un acusado culpable es absuelto. La probabilidad de un Tipo I
el error se denota por α que también se llama el nivel de significancia (alfa). La probabilidad
de un error de tipo II se denota por β (letra griega beta). Las probabilidades de error α y β son
relacionados inversamente, lo que significa que cualquier intento de reducir uno aumentará el otro.

Conceptos Críticos de HT

El procedimiento de prueba comienza con la suposición de que la hipótesis nula es verdadera.

El objetivo del proceso es determinar si hay suficiente evidencia para inferir que
la hipótesis alternativa es verdadera.

Hay dos decisiones posibles:

Concluya que hay suficiente evidencia para apoyar la hipótesis alternativa.


Concluye que no hay suficiente evidencia para apoyar la hipótesis alternativa.

Se pueden cometer dos errores posibles en cualquier prueba. Un error de Tipo I ocurre cuando rechazamos un
la hipótesis nula verdadera, y un error tipo II ocurre cuando no rechazamos una hipótesis nula falsa
hipótesis.

Las probabilidades de errores de Tipo I y Tipo II son

P(Error Tipo I) = α

P(Error tipo II) = β


Estadísticas de prueba: Muestree aleatoriamente la población y calcule la media de la muestra. Es
el criterio en el que basamos nuestra decisión sobre las hipótesis. Si la estadística de la prueba
el valor es inconsistente con la hipótesis nula, rechazamos la hipótesis nula e inferimos que
la hipótesis alternativa es verdadera.

Pasos involucrados:

1. Definir hipótesis (Nula = H0,


H1)
2. Identificar y anotar
a. Desviación estándar = sd
b. Media = x
c. Número de observaciones = n
d. Nivel de confianza
3. Cálculos:

Zcal => ya sea usando la distribución normal (NORMDIST) o memorizando la tabla anterior.

X - u = **

sd/sqrt(n) = ***

Zcal = (x-u)/ [sd/sqrt(n)]

Ahora compara el valor de z con la tabla y evalúa si aceptar o no aceptar, si es que


cae dentro del nivel de confianza z tab +ve a -ve. Ej. -1.96 < zcal < 1.96.

4. Luego menciona qué tipo de error has eliminado.

Unidad 12 Correlación

CORRELACIÓN - Una técnica estadística que analiza la relación entre 2


Las variables. La correlación se calcula entre 0 y 1.

Positivo (ambos suben y bajan juntos)


(La relación de cambio en las variables se mantiene constante a lo largo del tiempo), Curvilínea (positiva
correlación con un ratio de cambio separado cada vez).

Dos variables = correlación simple, Parcial = más de dos variables pero estudiando solo 2
después de hacer todos los demás constantes, Múltiple = Estudiar múltiples variables simultáneamente.
Grado de correlación:

Perfect - positive= 1; Negative= -1

Grado alto- positivo= 0.75 a 1; negativo= -0.75 a 1

Moderate- positive= 0.25 to 0.75; negative= -0.25 to 0.75

Low- Positive= 0 to 0.25; negative= 0 to -0.25

Es una medida de asociación lineal.

Paso a Paso en Excel:

Haga clic en datos > análisis de datos > seleccione correlación > rango de entrada: ambas columnas > menú desplegable
- rango de entrada = (A1:B10)

Función

= CORREL (A1: A10, B1: B10)

= PEARSON (A1: A10, B1: B10)

Coeficiente de correlación de Karl Pearson:

( . ) Σ( − )( − )
δ = σ ,σ
oδ = 2 2
( − ) − ( − )

2
Desviación estándarσ = ( − )

Covarianza
Coeficiente de correlación por rangos de Spearman:

ρ coeficiente de correlación de rango de Spearman

= ℎ

Dadas las observaciones sobre x, y, ordénalas de mayor a menor asignando números.


2
Obtener y , sustitúyelo en la fórmula y obtén el coeficiente.

Verifica con la función Pearson/Correl, como se hizo en el ejemplo a continuación

Unidad. 13 - 16 REGRESIÓN
Regresión: Estudio de la relación entre la variable independiente y la dependiente
variable. La regresión ayuda a predecir posibles valores de variables dependientes basadas en
sobre los independientes. La regresión nos ayuda a predecir cómo actuarán las variables dependientes si
el independiente aumenta o disminuye.

Siempre tiene una relación de causa y efecto.

El análisis de regresión se utiliza para predecir el valor de una variable en función de otra.
variable. Desarrolla una ecuación matemática o un modelo que describe la relación
entre la variable dependiente (variable a ser pronosticada) y la variable independiente
(creído por el practicante)

La regresión simple tiene solo 2 variables, la regresión múltiple = al menos 3 variables.

Siempre inserta una línea de tendencia en un diagrama de dispersión, además añade la ecuación lineal y R
valor cuadrado.

Pasos -

1. Seleccionar datos > gráficos recomendados > gráfico de dispersión >


2. Haz clic en el gráfico de dispersión > selecciona “+” > añade la línea de tendencia > más > mostrar línea lineal

mostrar el valor R cuadrado - escribir su interpretación

Modelo de Regresión Lineal Simple

El modelo de línea recta con una variable independiente. Este modelo se llama el
modelo lineal de primer orden— a veces llamado el modelo de regresión lineal simple.
Modelo Lineal de Primer Orden
y = β0 + β1x + ε
Dónde,
y = variable dependiente
x = variable independiente β
0 = intersección y
β1 = pendiente de la línea (definida como elevación / ejecución)

ε = variable de error

Se puede escribir la ecuación lineal como sigue (en el examen):

y = a + bx

(La pendiente también es el coeficiente de la variable independiente en la tabla ANOVA)


La pendiente se define como subida/horquilla, lo que significa que es el cambio en y (subida) por uno
aumento unitario en x (carrera). Dicho de forma menos matemática, la pendiente mide la tasa marginal
del cambio en la variable dependiente. La tasa marginal de cambio se refiere al efecto de
aumentando la variable independiente en una unidad adicional.
Intercepto - punto en el que la línea de regresión intersecta el eje y.

El coeficiente de correlación nos informa sobre la relación lineal, ya sea fuerte o


débil.
Consulta las páginas 636 y 637 del libro de texto para todas las fórmulas y ejemplos.

Error variable - abarca todas las variables, medibles y no medibles, que son
no forma parte del modelo.

El objetivo del problema abordado por el modelo es analizar la relación entre


dos variables, x e y, las cuales deben ser intervalos. Para definir la relación
entre x e y, necesitamos conocer el valor de los coeficientes β0 y β1. Sin embargo,
Estos coeficientes son parámetros de población, que casi siempre son desconocidos.

Salida residual - Los residuales son observaciones de la variable de error. Las desviaciones
entre los puntos de datos reales y la línea se llaman residuales, denotados como ei; es decir, ei =
yi − y^i

Función en Excel :-
1. Haga clic, Datos, Análisis de Datos y Regresión
2. Especifique el rango de entrada Y (A1:A101) y el rango de entrada X (B1:B101).
3. Dibujar diagrama de dispersión - seleccionar para graficar la línea de ajuste

Interpretación de la regresión

La regresión múltiple (R múltiple) mide la fuerza de la relación lineal


entre las variables independientes y la variable despondente sugiere. Ej. fuerte
relación positiva etc.

R cuadrado, que representa la proporción de varianza en la variable de respuesta que es


explicado por las variables independientes.

R cuadrado ajustado: toma en cuenta el número de variables dependientes en el


modelo (sugiere la variabilidad de esta variable y si es suficiente o no). Sugiere
que la adición de otras variables dependientes podría mejorar la capacidad del modelo para
explicar la variabilidad en las variables independientes.
Error estándar - indica la variabilidad o dispersión de los puntos de datos alrededor de
línea de regresión. Representa la distancia promedio a la que los valores observados se desvían de la
línea de regresión.

Observaciones: tamaño de la muestra/número de puntos de datos utilizados en el análisis.

Tabla ANOVA - es el Análisis de Varianza (ANOVA) que muestra las fuentes de variación en
el modelo de regresión.

Grados de libertad- gl

SS: Suma de cuadrados. Representa la variación explicada por el modelo de regresión.

MS: Media cuadrática. Se calcula dividiendo la suma de cuadrados entre su respectivo


grados de libertad.

F: La estadística F es una razón de los valores de cuadrados medios y prueba la significancia general
del modelo de regresión.

Significancia F: El valor p asociado con la estadística F. (ej. En este caso, es muy


pequeño (1.83945E-05), lo que indica que el modelo de regresión es estadísticamente significativo) -
menor que 5%

Coeficientes: La tabla ANOVA proporciona los coeficientes estimados para la intersección y el


variable(s) independiente(s).

- Intercepto: El intercepto estimado. Representa el valor predicho del


variable dependiente cuando todas las variables independientes son cero.
- Valor X (variable independiente): El coeficiente estimado para la independiente
variable. Indica que por cada unidad de aumento en la variable "independiente", el
el valor predicho de la variable dependiente aumenta en "cantidad del coeficiente".

Ej. Intercepto: El intercepto estimado es 26.917. Representa el


valor predicho de la variable dependiente cuando todas las variables independientes
son cero. Sobrepeso: El coeficiente estimado para la independiente
la variable "Sobrepeso" es 0.794. Indica que por cada aumento de unidad en
la variable "Sobrepeso", el valor predicho de la variable dependiente
aumenta en 0.794.
Salida residual: Esta tabla muestra los valores predichos, los residuos y los observados
valores para cada observación en el conjunto de datos.

- Valores predichos (de variables dependientes): Los valores predichos de la


variable dependiente basada en el modelo de regresión.
- Residuales: Las diferencias entre los valores observados y los predichos
valores. Los valores positivos indican que los valores reales son más altos que los predichos,
mientras que los valores negativos indican lo contrario.

Correlación vs regresión: la correlación mide el grado de relación y la regresión =


naturaleza de la variable.

La regresión es para causa y efecto y la correlación no lo es.

la correlación no puede predecir cosas. la correlación es una relación lineal. la correlación puede ser
entre cualquier cosa menos que la regresión no puede tener lugar entre cosas no relacionadas.

Covarianza: Una medida de variación en dos variables juntas utilizando sus medias.
Establece relaciones positivas o negativas entre dos variables.

Cuando la covarianza adquiere una escala definida, se llama correlación. También limita el rango de
Los datos. La covarianza da dirección y la relación también da fuerza. Covarianza en unidades.

Hoja resuelta Xm 16-06

Unidad. 17 - 18 Series de Tiempo

Series de tiempo - Los datos de series de tiempo a menudo se representan gráficamente en un gráfico de líneas, que es un

gráfico de la variable a lo largo del tiempo. Se crea al representar el valor de la variable en el


el eje vertical y los períodos de tiempo en el eje horizontal.

- Cualquier variable que se mide a lo largo del tiempo en orden secuencial se llama serie temporal
El análisis de series temporales ayuda a detectar patrones que nos permitirán prever.
valores futuros de la serie temporal.
- Cualquier dato que esté indexado con respecto al tiempo es una serie temporal.

Aplicación, hay un número casi ilimitado de tales aplicaciones en la gestión.


y economía. (algunos ejemplos):
1. Los gobiernos quieren conocer los valores futuros de las tasas de interés, las tasas de desempleo, y
aumentos porcentuales en el costo de la vida.

Los economistas de la industria de la vivienda deben prever las tasas de interés hipotecarias, la demanda de
vivienda y el costo de los materiales de construcción.

3. Muchas empresas intentan predecir la demanda de sus productos y su participación en


el mercado.

4. Las universidades y colegios a menudo intentan predecir el número de estudiantes que estarán
solicitando la aceptación en instituciones de educación superior

Componentes de Series Temporales (4 variaciones/características)

1. Tendencia a largo plazo - Una tendencia (también conocida como tendencia secular) es una tendencia a largo plazo, relativamente

patrón o dirección suave exhibida por una serie. Su duración es de más de 1 año. [TSCI]

Por ejemplo, la población de los Estados Unidos mostró una tendencia relativamente estable
crecimiento de 157 millones en 1952 a 314 millones en 2012.

2. Variación cíclica: es un patrón en forma de onda que describe una tendencia a largo plazo que es
generalmente aparente a lo largo de varios años, resultando en un efecto cíclico. Por definición, es
tiene una duración de más de 1 año. Sin embargo, los patrones cíclicos que son consistentes y
predecibles son bastante raros. Para fines prácticos, ignoraremos este tipo de variación

Ejemplos incluyen ciclos económicos que registran períodos de recesión económica y


inflación, ciclos de demanda de productos a largo plazo y ciclos en la economía monetaria y financiera
sectores.

3.Variación estacional- se refiere a ciclos que ocurren en periodos calendarios repetitivos cortos
y, por definición, tienen una duración de menos de 1 año. Causado por irregular y
cambios impredecibles y ningún otro componente.

Por ejemplo, el término variación estacional puede referirse a las cuatro estaciones tradicionales o a
patrones sistemáticos que ocurren durante un mes, una semana o incluso un día. La demanda de
los restaurantes presentan una variación "estacional" a lo largo del día.

4. Variación aleatoria/irregular - es causada por cambios irregulares e impredecibles en un


series temporales que no son causadas por ningún otro componente. Tiende a enmascarar la existencia
de los otros componentes más predecibles. Porque la variación aleatoria existe en casi
todas las series temporales, por lo que estudiamos las formas de reducir la variación aleatoria, lo que permite
nosotros para describir y medir los otros componentes. Al hacerlo, esperamos poder
hacer predicciones precisas de la serie temporal.

Una media móvil para un período de tiempo es la media aritmética de los valores en ese tiempo
período y aquellos cercanos a él. Es una serie de promedios, calculados a partir de datos históricos.

Cálculo en Excel

2. ClickData, Análisis de Datos y Media Móvil.

3. Especifique el rango de entrada (A1:A17). Especifique el número de períodos (3) y la salida.


Rango (B1). Intervalo (3 o 5)

4. Elimina las celdas que contienen N/A.

5. Para dibujar los gráficos de líneas.

En Excel: Sumar y dividir por 3 para el promedio móvil de tres trimestres, primer y último valor no incluidos.
incluido

En Excel: Sumar y dividir por 5 para el promedio móvil de cinco trimestres, los dos primeros y los dos últimos
valores no incluidos

También podría gustarte