0% encontró este documento útil (0 votos)

285 vistas11 páginas

Análisis Econométrico Con Python y Statsmodels

Este documento proporciona una guía para realizar análisis econométricos con Python y Statsmodels. Primero, carga datos sobre viviendas en Boston y selecciona variables. Luego, estima un modelo de regresión lineal para predecir el valor de las viviendas basado en dos variables. Finalmente, realiza pruebas de hipótesis sobre los coeficientes y la significancia general del modelo, y evalúa supuestos como la normalidad de los residuos.

Cargado por

alvarito mendez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

285 vistas11 páginas

Análisis Econométrico Con Python y Statsmodels

Cargado por

alvarito mendez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 11

Guía para el Análisis

Econométrico con Python y

Statsmodels
Análisis Econométrico con Python y
Statsmodels
Autor: Sergio Diaz Paredes

Contacto: Linkedin

Importando paquetes
In [2]: import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf

Cargando data
In [ ]: pip install ISLP

In [4]: from ISLP import load_data

Boston = load_data('Boston')

In [5]: Boston.head()

Out[5]: crim zn indus chas nox rm age dis rad tax ptratio lstat medv

0 0.00632 18.0 2.31 0 0.538 6.575 65.2 4.0900 1 296 15.3 4.98 24.0

1 0.02731 0.0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 9.14 21.6

2 0.02729 0.0 7.07 0 0.469 7.185 61.1 4.9671 2 242 17.8 4.03 34.7

3 0.03237 0.0 2.18 0 0.458 6.998 45.8 6.0622 3 222 18.7 2.94 33.4

4 0.06905 0.0 2.18 0 0.458 7.147 54.2 6.0622 3 222 18.7 5.33 36.2

In [6]: Boston.columns

Index(['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
Out[6]:
'ptratio', 'lstat', 'medv'],
dtype='object')

CRIM: Tasa de criminalidad per cápita por área.

ZN: Proporción de terreno residencial dividido en zonas para lotes de más de 25,000
pies cuadrados.
INDUS: Proporción de acres de negocios no minoristas por ciudad.
CHAS: Variable ficticia de Charles River (1 si el tramo limita con el río; 0 en caso
contrario).
NOX: Concentración de óxidos de nitrógeno (partes por 10 millones).
RM: Número medio de habitaciones por vivienda.
AGE: Proporción de unidades ocupadas por el propietario construidas antes de 1940.
DIS: Distancias ponderadas a cinco centros de empleo de Boston.
RAD: Índice de accesibilidad a carreteras radiales.
TAX: Tasa de impuesto a la propiedad de valor total por $10,000 .
PTRATIO: Proporción alumno-profesor por localidad.
LSTAT: Porcentaje de la población de menor estatus.
MEDV: Valor medio de las viviendas ocupadas por el propietario en $1000 .

Selección de variables
In [7]: Boston.corr().medv.abs().sort_values(ascending=False)[1:].plot(kind='bar')

<Axes: >
Out[7]:

In [8]: df = Boston[['medv','lstat','rm']]
df.head()

Out[8]: medv lstat rm

0 24.0 4.98 6.575

1 21.6 9.14 6.421

2 34.7 4.03 7.185

3 33.4 2.94 6.998

4 36.2 5.33 7.147

In [9]: sns.pairplot(df)
<seaborn.axisgrid.PairGrid at 0x7fb39ce57820>
Out[9]:

Estimando el modelo
In [10]: modelo = smf.ols("medv ~ lstat + rm", data=df).fit()
print(modelo.summary())
OLS Regression Results
==============================================================================
Dep. Variable: medv R-squared: 0.639
Model: OLS Adj. R-squared: 0.637
Method: Least Squares F-statistic: 444.3
Date: Wed, 07 Feb 2024 Prob (F-statistic): 7.01e-112
Time: 07:23:18 Log-Likelihood: -1582.8
No. Observations: 506 AIC: 3172.
Df Residuals: 503 BIC: 3184.
Df Model: 2
Covariance Type: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
Intercept -1.3583 3.173 -0.428 0.669 -7.592 4.875
lstat -0.6424 0.044 -14.689 0.000 -0.728 -0.556
rm 5.0948 0.444 11.463 0.000 4.222 5.968
==============================================================================
Omnibus: 145.712 Durbin-Watson: 0.834
Prob(Omnibus): 0.000 Jarque-Bera (JB): 457.690
Skew: 1.343 Prob(JB): 4.11e-100
Kurtosis: 6.807 Cond. No. 202.
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly s
pecified.

In [11]: from statsmodels.graphics.regressionplots import plot_partregress

fig, axs = plt.subplots(2, 1, figsize=(8, 12))

plot_partregress('medv', 'lstat', ['rm'], data=df, obs_labels=False, ax=axs[0])

axs[0].set_title('Regresión Parcial para lstat')

plot_partregress('medv', 'rm', ['lstat'], data=df, obs_labels=False, ax=axs[1])

axs[1].set_title('Regresión Parcial para rm')

plt.tight_layout(pad=1.5)
plt.show()
Pruebas de hipotesis

1. Prueba t para cada coeficiente

H0 : β ⋅ (1) = 0
1

In [12]: print("Pruebas t:")

print(modelo.t_test([0, 1, 0]))

Pruebas t:
Test for Constraints
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
c0 -0.6424 0.044 -14.689 0.000 -0.728 -0.556
==============================================================================

H0 : β ⋅ (1) = 0
2

In [13]: print(modelo.t_test([0, 0, 1]))

Test for Constraints

==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
c0 5.0948 0.444 11.463 0.000 4.222 5.968
==============================================================================

2. Prueba t para combinacion de parametros igual a cero

H0 : β ⋅ (1) + β ⋅ (1) = 0
1 2

In [14]: print(modelo.t_test([0, 1, 1]))

Test for Constraints

==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
c0 4.4524 0.473 9.422 0.000 3.524 5.381
==============================================================================

H0 : β ⋅ (8) + β ⋅ (1) = 0
1 2

In [15]: print(modelo.t_test([0, 8, 1]))

Test for Constraints

==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
c0 -0.0441 0.715 -0.062 0.951 -1.448 1.360
==============================================================================

3. Prueba F para la significancia global del modelo

In [16]: resultado_prueba = modelo.f_test("lstat = rm = 0")
print("Prueba F para la significancia global del modelo:")

print("\nEstadístico F:", resultado_prueba.fvalue)

print("Valor p:", resultado_prueba.pvalue)
print("Grados de libertad:", resultado_prueba.df_num, "y", resultado_prueba.df_deno
Prueba F para la significancia global del modelo:

Estadístico F: 444.33089222433387
Valor p: 7.008455349884948e-112
Grados de libertad: 2.0 y 503.0

In [17]: resultado_prueba = modelo.f_test("8*lstat + rm = 0")

print("Prueba F para la combinación lineal 8*lstat + rm = 0:")

print("\nEstadístico F:", resultado_prueba.fvalue)

print("Valor p:", resultado_prueba.pvalue)
print("Grados de libertad:", resultado_prueba.df_num, "y", resultado_prueba.df_deno

Prueba F para la combinación lineal 8*lstat + rm = 0:

Estadístico F: 0.003803429875208457
Valor p: 0.9508485721991239
Grados de libertad: 1.0 y 503.0

Evaluacion de supuestos

1. Normalidad de residuos
In [18]: residuos = modelo.resid
fig, ax = plt.subplots()
sns.histplot(residuos, kde=True, ax=ax)
ax.set_title('Distribución de Residuos')
plt.show()

In [19]: from scipy.stats import shapiro

stat, p_value = shapiro(residuos)
print("Estadístico de prueba:", stat,"\nValor p:", p_value)

alpha = 0.05
if p_value > alpha:
print("No se rechaza la hipótesis nula. Los residuos parecen seguir una distrib
else:
print("Se rechaza la hipótesis nula. Los residuos no siguen una distribución no

Estadístico de prueba: 0.9097991585731506

Valor p: 9.090163698797569e-17
Se rechaza la hipótesis nula. Los residuos no siguen una distribución normal.

In [20]: from scipy.stats import shapiro, norm

In [21]: fig, ax = plt.subplots()

sns.histplot(residuos, kde=True, ax=ax, stat="density", color='blue', label='Residu

xmin, xmax = plt.xlim()

x = np.linspace(xmin, xmax, 100)
p = norm.pdf(x, np.mean(residuos), np.std(residuos))
ax.plot(x, p, 'k', linewidth=2, label='Curva de Densidad Normal')

ax.set_title('Distribución de Residuos con Curva de Densidad Normal')

ax.legend()
plt.show()

2. Homocedasticidad
In [22]: predicciones = modelo.predict(df)
residuos_estandarizados = modelo.get_influence().resid_studentized_internal

In [23]: fig, ax = plt.subplots()

ax.scatter(predicciones, residuos_estandarizados)
ax.axhline(y=0, color='gray', linestyle='--')
ax.set_title('Homocedasticidad de Residuos Estandarizados')
plt.show()
In [24]: from statsmodels.stats.diagnostic import het_breuschpagan

_, p_value, _, _ = het_breuschpagan(modelo.resid, modelo.model.exog)

print("Valor p del Test de Breusch-Pagan:", p_value)

alpha = 0.05
if p_value > alpha:
print("No se rechaza la hipótesis nula. No hay evidencia de heterocedasticidad.
else:
print("Se rechaza la hipótesis nula. Hay evidencia de heterocedasticidad.")

Valor p del Test de Breusch-Pagan: 0.4653943799016529

No se rechaza la hipótesis nula. No hay evidencia de heterocedasticidad.

3. Autocorrelación de residuos
In [25]: from statsmodels.stats.stattools import durbin_watson

durbin_watson_stat = durbin_watson(modelo.resid)

print("Estadístico de Durbin-Watson:", durbin_watson_stat)

# Para datos no ordenados en el tiempo, un valor cerca de 2 indica no autocorrelaci

# Valores cercanos a 0 o 4 sugieren autocorrelación positiva o negativa, respectiva

Estadístico de Durbin-Watson: 0.8342146070001708

4. Multicolinealidad (VIF)
In [26]: modelo.model.exog
array([[1. , 4.98 , 6.575],
Out[26]:
[1. , 9.14 , 6.421],
[1. , 4.03 , 7.185],
...,
[1. , 5.64 , 6.976],
[1. , 6.48 , 6.794],
[1. , 7.88 , 6.03 ]])

In [27]: from statsmodels.stats.outliers_influence import variance_inflation_factor

X = modelo.model.exog
vif = pd.DataFrame()
vif['Variable'] = ['cons','lstat', 'rm']
vif['VIF'] = [variance_inflation_factor(X, i) for i in range(X.shape[1])]
print(vif)
# Solo analizamos las variables que(no la constante)

Variable VIF
0 cons 165.952438
1 lstat 1.604520
2 rm 1.604520

También podría gustarte

Prueba T ANOVA
Aún no hay calificaciones
Prueba T ANOVA
10 páginas
Regresión Lineal Simple
Aún no hay calificaciones
Regresión Lineal Simple
5 páginas
Análisis de Regresión Lineal Múltiple
Aún no hay calificaciones
Análisis de Regresión Lineal Múltiple
2 páginas
Análisis de Regresión y Heterocedasticidad en STATA
Aún no hay calificaciones
Análisis de Regresión y Heterocedasticidad en STATA
10 páginas
Inferencial II Tema2-Parte2
Aún no hay calificaciones
Inferencial II Tema2-Parte2
25 páginas
Modelo Probit
Aún no hay calificaciones
Modelo Probit
14 páginas
Regresión Lineal Simple: Fórmulas y Análisis
Aún no hay calificaciones
Regresión Lineal Simple: Fórmulas y Análisis
22 páginas
Análisis de Pruebas Estadísticas
Aún no hay calificaciones
Análisis de Pruebas Estadísticas
10 páginas
Examen Parcial II 2016-I 206-T Fila A (Solucion) PDF
Aún no hay calificaciones
Examen Parcial II 2016-I 206-T Fila A (Solucion) PDF
4 páginas
Parcial 1 Econometría I v2 SOLUCIÓN
100% (1)
Parcial 1 Econometría I v2 SOLUCIÓN
4 páginas
Semana 14 Tarea 14 Interdependencia
Aún no hay calificaciones
Semana 14 Tarea 14 Interdependencia
20 páginas
00examen Parcial Econometria II 2021 - II - UARM - Palomares - 151021 - FAB
Aún no hay calificaciones
00examen Parcial Econometria II 2021 - II - UARM - Palomares - 151021 - FAB
9 páginas
Examen Módulo Metodos Cuantitativos II Terminado
Aún no hay calificaciones
Examen Módulo Metodos Cuantitativos II Terminado
7 páginas
Análisis de Importaciones y Multicolinealidad
Aún no hay calificaciones
Análisis de Importaciones y Multicolinealidad
7 páginas
Taller Regresion Multiple Econometria
Aún no hay calificaciones
Taller Regresion Multiple Econometria
24 páginas
Variables Dummy y Predicciones Con Modelo de Regresion Lineal Multiple
Aún no hay calificaciones
Variables Dummy y Predicciones Con Modelo de Regresion Lineal Multiple
8 páginas
Control 2 - Eco
Aún no hay calificaciones
Control 2 - Eco
13 páginas
Regresión Lineal Múltiple Con Python
Aún no hay calificaciones
Regresión Lineal Múltiple Con Python
6 páginas
Ceoten y Salarios
Aún no hay calificaciones
Ceoten y Salarios
7 páginas
Trabajo de Econometria
Aún no hay calificaciones
Trabajo de Econometria
9 páginas
Taller Ejercicio 2k
Aún no hay calificaciones
Taller Ejercicio 2k
8 páginas
Actividad 6 - Grupo 29 - NRC - 1410
Aún no hay calificaciones
Actividad 6 - Grupo 29 - NRC - 1410
4 páginas
Regresión: Intervalos y Pruebas
Aún no hay calificaciones
Regresión: Intervalos y Pruebas
27 páginas
TALLER 6 Multicolinealidad Heterocedasticidad y Autocorrelacion
Aún no hay calificaciones
TALLER 6 Multicolinealidad Heterocedasticidad y Autocorrelacion
8 páginas
Ejercicio 10
Aún no hay calificaciones
Ejercicio 10
9 páginas
Ayudantia 2 Apuntes 486651
Aún no hay calificaciones
Ayudantia 2 Apuntes 486651
8 páginas
Regresion Lineal
Aún no hay calificaciones
Regresion Lineal
7 páginas
Ejercicios Parte 3
Aún no hay calificaciones
Ejercicios Parte 3
25 páginas
β1
Aún no hay calificaciones
β1
18 páginas
Lab4 Jose de Jesus Cruz Urrutia
Aún no hay calificaciones
Lab4 Jose de Jesus Cruz Urrutia
4 páginas
Formas Funcionales en Econometría
Aún no hay calificaciones
Formas Funcionales en Econometría
22 páginas
Estadística Intermedia Clase 08 2024
Aún no hay calificaciones
Estadística Intermedia Clase 08 2024
12 páginas
Prueba en R
Aún no hay calificaciones
Prueba en R
4 páginas
Regresi ZMN
Aún no hay calificaciones
Regresi ZMN
6 páginas
Ejercicio 1 Autocorrelación
Aún no hay calificaciones
Ejercicio 1 Autocorrelación
5 páginas
Fmsa315 - s11 - Taller - Ipynb - Colaboratory
100% (1)
Fmsa315 - s11 - Taller - Ipynb - Colaboratory
8 páginas
2da Parte Minitab
Aún no hay calificaciones
2da Parte Minitab
8 páginas
Supuestos de MCO
Aún no hay calificaciones
Supuestos de MCO
3 páginas
Cambio Estructural
Aún no hay calificaciones
Cambio Estructural
23 páginas
Estadística Avanzada Clase 12 2024
Aún no hay calificaciones
Estadística Avanzada Clase 12 2024
14 páginas
Interpretación de Los Coeficientes PDF
Aún no hay calificaciones
Interpretación de Los Coeficientes PDF
5 páginas
Examen Diagnóstico de Econometría II
100% (1)
Examen Diagnóstico de Econometría II
3 páginas
Tarea 2 Nicolas Ernesto Aguirre Tobar
Aún no hay calificaciones
Tarea 2 Nicolas Ernesto Aguirre Tobar
22 páginas
Análisis de Demanda de Rosas en Detroit
Aún no hay calificaciones
Análisis de Demanda de Rosas en Detroit
15 páginas
Regresión Lineal Simple en Python
Aún no hay calificaciones
Regresión Lineal Simple en Python
9 páginas
Econometria
Aún no hay calificaciones
Econometria
32 páginas
Analisis de Regresion Probit Con R Studio
Aún no hay calificaciones
Analisis de Regresion Probit Con R Studio
18 páginas
Tarea 6
Aún no hay calificaciones
Tarea 6
4 páginas
1FCE0087 Instructivo Regresión Lineal Simple Con R Commander
Aún no hay calificaciones
1FCE0087 Instructivo Regresión Lineal Simple Con R Commander
5 páginas
Regreción Lineal1
Aún no hay calificaciones
Regreción Lineal1
27 páginas
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
Aún no hay calificaciones
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
6 páginas
Cpy3jullpjn0l9 Agosto 24 Regresion Simple I PDF Application PDF
Aún no hay calificaciones
Cpy3jullpjn0l9 Agosto 24 Regresion Simple I PDF Application PDF
21 páginas
Examen Final - Parte Práctica (C) .
Aún no hay calificaciones
Examen Final - Parte Práctica (C) .
7 páginas
Laboratorio 1
Aún no hay calificaciones
Laboratorio 1
12 páginas
Estimación Por Intervalos y Pruebas S6
Aún no hay calificaciones
Estimación Por Intervalos y Pruebas S6
18 páginas
Estadistica Aplicada . - Tarea 2
Aún no hay calificaciones
Estadistica Aplicada . - Tarea 2
10 páginas
Listas J6J01GDT7
Aún no hay calificaciones
Listas J6J01GDT7
2 páginas
Wuolah Free Tema 1 Gulag Free
Aún no hay calificaciones
Wuolah Free Tema 1 Gulag Free
63 páginas
Wuolah Free Tema 2 Gulag Free
Aún no hay calificaciones
Wuolah Free Tema 2 Gulag Free
71 páginas
Formulario FFII
Aún no hay calificaciones
Formulario FFII
2 páginas
Pot in Pot
Aún no hay calificaciones
Pot in Pot
12 páginas
Mejora de Gestión en Asignar SAS
Aún no hay calificaciones
Mejora de Gestión en Asignar SAS
17 páginas
Practica 01 PDF
Aún no hay calificaciones
Practica 01 PDF
3 páginas
Qué Es El Método Cuantitativo
Aún no hay calificaciones
Qué Es El Método Cuantitativo
12 páginas
Diagnóstico de Cultura Organizacional
Aún no hay calificaciones
Diagnóstico de Cultura Organizacional
8 páginas
Econometría
Aún no hay calificaciones
Econometría
1 página
Evaluación Docente Universitaria
Aún no hay calificaciones
Evaluación Docente Universitaria
16 páginas
Introducción a Variables Estadísticas
Aún no hay calificaciones
Introducción a Variables Estadísticas
4 páginas
s13 Actividad de Aprendizaje
Aún no hay calificaciones
s13 Actividad de Aprendizaje
24 páginas
Formato Del Estudio de Caso Con La Info
Aún no hay calificaciones
Formato Del Estudio de Caso Con La Info
26 páginas
Tarea 2 Taller 2 BLOG
Aún no hay calificaciones
Tarea 2 Taller 2 BLOG
3 páginas
Diagnóstico Integral A Carirubana E.P.S. Terminal de Pasajeros "Alí Primera" S.A.
Aún no hay calificaciones
Diagnóstico Integral A Carirubana E.P.S. Terminal de Pasajeros "Alí Primera" S.A.
67 páginas
Introduccion A Modelos de Optimizacion
Aún no hay calificaciones
Introduccion A Modelos de Optimizacion
66 páginas
Las Prácticas Curativas Del Tratamiento Tradicional
Aún no hay calificaciones
Las Prácticas Curativas Del Tratamiento Tradicional
2 páginas
Estadística: Ejercicios Prácticos
Aún no hay calificaciones
Estadística: Ejercicios Prácticos
18 páginas
Investigacion Cualitativa de Mercados Unidad 4 Actividad 6 Cuestionario
Aún no hay calificaciones
Investigacion Cualitativa de Mercados Unidad 4 Actividad 6 Cuestionario
6 páginas
Estudio de Canteras - Definitivo
Aún no hay calificaciones
Estudio de Canteras - Definitivo
21 páginas
Evaluación Escritura de Reportaje
Aún no hay calificaciones
Evaluación Escritura de Reportaje
3 páginas
Conceptos Básicos de Estadística Aplicada
Aún no hay calificaciones
Conceptos Básicos de Estadística Aplicada
13 páginas
Presentacion para Defensa de Emprendimiento Productivo Unibol CMVZ 2025
Aún no hay calificaciones
Presentacion para Defensa de Emprendimiento Productivo Unibol CMVZ 2025
18 páginas
Ciencia, Técnica y Tecnología
Aún no hay calificaciones
Ciencia, Técnica y Tecnología
2 páginas
Filtros Purificadores
0% (1)
Filtros Purificadores
234 páginas
FTGGT
Aún no hay calificaciones
FTGGT
11 páginas
Cómo Elaborar Un Marco Metodológico
Aún no hay calificaciones
Cómo Elaborar Un Marco Metodológico
3 páginas
Revisión Gastronomia Molecular
Aún no hay calificaciones
Revisión Gastronomia Molecular
20 páginas
Ejercicio de Estadistica 9 y 14
100% (3)
Ejercicio de Estadistica 9 y 14
5 páginas
Spi (Spider Tool)
Aún no hay calificaciones
Spi (Spider Tool)
19 páginas
Control Total de Calidad - Removed
Aún no hay calificaciones
Control Total de Calidad - Removed
26 páginas
Sistema Web para Mantenimiento Biomédico
Aún no hay calificaciones
Sistema Web para Mantenimiento Biomédico
114 páginas
Frecuencia Absoluta y Relativa
Aún no hay calificaciones
Frecuencia Absoluta y Relativa
22 páginas
Actividad 2
Aún no hay calificaciones
Actividad 2
5 páginas