0% encontró este documento útil (0 votos)

275 vistas51 páginas

Correlacion

Este documento presenta información sobre análisis de correlación simple y regresión lineal. Explica conceptos como diagrama de dispersión, covarianza, coeficiente de correlación, ecuación de regresión lineal, y prueba t del coeficiente de correlación. También analiza la diferencia entre análisis de correlación y regresión, y revisa conceptos como error estándar de estimación, coeficiente de determinación, y suposiciones de la regresión lineal.

Cargado por

magy

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

275 vistas51 páginas

Correlacion

Cargado por

magy

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 51

FACULTAD DE INGENIERIA DE PROCESOS

ASIGNATURA: ESTADISTICA INDUSTRIAL (IQ313APQ)

DOCENTE: DRA. LECSI MARICELA ROMERO PEÑA

Contenido : REGRESION LINEAL Y CORRELACIÓN (A)

MATERIAL DE ESTUDIO (PARTE 9)

2017-II
Análisis de correlación simple

Análisis de correlación simple: permite obtener la

relación entre dos conjunto de datos.

Para investigar la relación entre dos variables es

conveniente considerar:

 Las observaciones que muestran los valores de las

variables.

 Si se tiene “n” observaciones bidimensionales,

cada par de puntos(X, Y) se representa en un
sistema de coordenadas rectangulares por un
punto como parejas de observaciones se tenga.
Análisis de correlación simple

 La representación de los puntos en el sistema de coordenadas

rectangulares, da origen al diagrama de dispersión.

 El diagrama de dispersión en una gráfica en la que cada punto

trazado representa el par de valores observados de las variables
independientes y dependientes.

 La gráfica del diagrama de dispersión nos permite visualizar el

valor de la variable independiente “X” en el eje horizontal y el
valor de la variable dependiente “Y” en el eje vertical.
Diagramas de correlación que representan correlaciones cero,
débil y fuerte
covarianza
Covarianza
Supongamos que tenemos dos variables aleatorias X e Y,
discretas o continuas, con función de probabilidad o densidad
conjunta f(x,y) y definimos una función z(x,y) igual al producto
de las desviaciones de cada valor a su media respectiva (es
decir, z(x,y) tiene la misma estructura que (X - μ)2 = (X - μ) (X - μ)
si sustituimos una vez a X por Y).

Cov(x,y) = xy =

Al valor esperado de z(x,y) se le llama covarianza de las

variables X e Y y se representa como σxy o cov(x,y).

La covarianza es una medida de la variación común a dos variables y, por

tanto, una medida del grado y tipo de su relación.
Coeficiente de correlación

Creado por Karl Pearson alrededor de 1900, es una medida de

la fuerza de la relación lineal entre dos variables en escala de
intervalo o de razón.

El coeficiente de correlación se define como el cociente

entre la covarianza y el producto de las desviaciones
estándar de las dos variables.
Coeficiente de correlación muestral (r):

O también

En las fórmulas:
(xi, yi ) = Observaciones individuales para el elemento i
(x , y ) = Medias muestrales.
(Sx, Sy) = desvíos estándares muestrales en x e y respectivamente.
(Sxy) = covarianza muestral.
n = número de elementos de la muestra
Coeficiente de correlación poblacional ():

En la fórmula:

 = es el coeficiente de correlacional poblacional

xy = es la covarianza poblacional de (x,y)
x = es la desviación estándar poblacional de la variable x
y = es la desviación estándar poblacional de la variable y
Coeficiente de correlación (r)
Características:
1. El coeficiente de correlación de la muestra se identifica con la
letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta)
entre dos variables en escala de intervalo o en escala de razón.
3. Varía de -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las
variables.
5. Un valor cercano a 1 indica una asociación directa o positiva
entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa
entre las variables.
Ejemplo 1
El propietario de una empresa desea analizar la relación entre
las ventas y la suma de dinero que gastó en publicidad. A
continuación se presenta la información de las ventas y de los
gastos publicitarios durante los últimos cuatro meses.

a) El propietario desea pronosticar las ventas con base en los

gastos publicitarios. ¿Cuál es la variable dependiente? ¿Cuál es
la variable independiente?
b) Trace un diagrama de dispersión.
c) Determine el coeficiente de correlación.
d) Interprete la fuerza del coeficiente de correlación.
Respuestas

• a) Variable independiente: Gastos en publicidad

• Variable dependiente: Ingreso de ventas
d) Hay una correlación fuerte
Prueba t del coeficiente de correlación
Las hipótesis nula y alternativa son:

PRUEBA t DEL COEFICIENTE con n-2n-2 grados de libertad

DE CORRELACIÓN

Regla de decisión en la prueba de hipótesis con un nivel de significancia

de 0.05
Autoevaluación
Una muestra de 25 campañas para la alcaldía de ciudades de tamaño
medio con poblaciones entre 50 000 y 250 000 habitantes demostró
que la correlación entre el porcentaje de los votos recibidos y la
cantidad gastada en la campaña por cada candidato fue 0.43. A un
nivel de significancia de 0.05, ¿hay una asociación positiva entre las
variables?
Respuesta
Regresión lineal simple

• Los métodos de regresión estudian los modelos para explicar la

dependencia entre una variable independiente (respuesta) (y) y las
variables explicativas o dependientes (X).

• El modelo de regresión lineal , tiene lugar cuando la dependencia

es de tendencia lineal y se usa para dar respuesta a dos cuestiones
básicas:
• ¿Es significativo el efecto que una variable X causa sobre otra Y?,
• ¿ Es significativa la dependencia lineal entre esas dos variables?.
Regresión: Objetivos

• Investigar si existe una asociación entre las dos variables.

• Estudiar la fuerza de la asociación, a través de una medida de

asociación denominada coeficiente de correlación.

• Estudiar la forma de la relación. Usando los datos se propone un

modelo para la relación que permitirá predecir el valor de una
variable a partir de la otra.
Regresión: Objetivos

• Determinar una ecuación que pueda utilizarse en pronósticos.

• Medir el error del pronóstico.

• Presentar las consideraciones en que se basa el análisis de

regresión.

• Determinar intervalos de confianza para los pronósticos.

Análisis de regresión
El análisis de la regresión es un proceso estadístico para
estimar las relaciones entre variables

La técnica para desarrollar una ecuación lineal entre dos

variables y proporcionar las estimaciones de la variable
dependiente Y en base a un valor seleccionado de la
variable independiente X .

Ecuación de regresión. Ecuación que expresa la relación

lineal entre dos variables.
Análisis de regresión
Principio de los mínimos cuadrados. Determina una ecuación
de regresión al minimizar la suma de los cuadrados de las
distancias verticales entre los valores reales (observados) de
Y y los valores pronosticados (estimados) de Y.

El criterio de mínimos cuadrados permite obtener la ecuación

de mejor ajuste.
Ecuación de la línea recta

Forma general de la ecuación de regresión lineal: Ŷ = a + bX

Ecuación de la línea recta

Forma general de la ecuación de regresión lineal: Ŷ = a + bX

Intersección con el eje y: a = Ῡ - bX

Diferencia entre el análisis de regresión y
el análisis de correlación

La regresión y la correlación son dos técnicas

estrechamente relacionadas y comprenden una forma de
estimación. ... El análisis de correlación produce un
número que resume el grado de la correlación entre dos
variables; y el análisis de regresión da lugar a una
ecuación matemática que describe dicha relación.
Autoevaluación
Consulte la autoevaluación 1, donde el propietario estudió la
relación entre las ventas y la cantidad que gastaba en
publicidad. La información de las ventas de los cuatro últimos
meses se repite a continuación.
a) Determine la ecuación de regresión.
b) Interprete los valores de a y b.
c) Estime las ventas cuando se gastan $3 millones en
publicidad.
Respuestas
Ejercicio
Una compañía de electricidad estudia la relación entre los
kilowatts-hora (miles) consumidos y el número de
habitaciones de una residencia privada familiar. Una muestra
aleatoria de 10 casas reveló lo siguiente.

Nro de habitaciones 12 9 14 6 10 8 10 10 5 7
Kilowatts-hora (miles) 9 7 10 5 8 6 8 10 4 7

a) Determine la ecuación de regresión

b) Encuentre el número de kilowatts-hora, en miles, de una
casa de seis habitaciones.
Prueba de significancia de la pendiente
Las hipótesis nula y alternativa son:
H0: β=0
H1: β≠0
Donde β representa la pendiente de la población de la ecuación
de regresión.
Identificamos el valor de la pendiente como b. Así que la
pendiente “b” calculada se basa en una muestra y es una
estimación de la pendiente de la población, identificada como
“β”.
La hipótesis nula es que la pendiente de la ecuación de
regresión de la población es cero. Si éste es el caso, la recta
de regresión es horizontal y no existe relación entra la variable
independiente, X, y la variable dependiente, Y.
Si se rechaza H0 y se acepta H1, se deduce que la pendiente
de la recta de regresión de la población no es igual a cero;
existe una relación significativa entre las variables X e Y.
Prueba de significancia de la pendiente

b es la estimación de la pendiente de la recta de regresión,

calculada a partir de la estimación de la muestra.
sb es el error estándar de la estimación de la pendiente.
Excel. Regresión
Kw-hr = 1.3333 + 0.66667
habitaciones

Error estándar de estimación

SS
R
SSTotal
Capacidad predictora de una ecuación de
regresión

Error estándar de estimación. Medida de la dispersión de los

valores observados respecto de la recta de regresión para un
valor dado de X.
Capacidad predictora de una ecuación de
regresión

Coeficiente de determinación, r2. Proporción de la

variación total de la variable dependiente Y que se
explica, o contabiliza, por la variación de la variable
dependiente X.
Suposiciones de la regresión lineal
Intervalos de confianza e intervalos de
predicción
• Intervalo de confianza. Se utiliza para predecir el valor medio de Y para
una X dada.

• Intervalo de predicción. Se usa para predecir una Y individual para un

• valor dado de X.
Ejercicios
58 y 59 (páginas 506 y 507).
Análisis de regresión múltiple

La ecuación lineal múltiple para k variables independientes es

Donde
a es la intersección, el valor de Y cuando todas las X son cero
bi es la cantidad en que Y cambia cuando esa Xj particular
aumenta una unidad, cuando los valores de todas las demás
variables independientes se mantienen constantes. i=1..k
Prueba global del modelo de regresión
múltiple
La hipótesis nula es:
H0: β1 = β2 = β3 = 0
H1: No todas las βi son 0.
Evaluación de los coeficientes de regresión
individuales
La distribución de muestreo de los coeficientes sigue la
distribución t con n – (k+1) grados de libertad.
Las variables independientes se pueden probar individualmente
para determinar si los coeficientes de regresión difieren de cero.

El coeficiente bi se refiere a cualquiera de los coeficientes de

regresión, y sbi, a la desviación estándar de esa distribución del
coeficiente de regresión. Se incluye 0 debido a que la hipótesis
nula es βi = 0.
Supuestos de la regresión múltiple
1. Existe una relación lineal entre la variable dependiente y c/u
de las variables independientes
2. La variación entre los residuos es la misma tanto
para valores grandes como pequeños de . Esto significa
que los valores de predicción es constante, sin que importe
si los valores de predicción son grandes o pequeños
(homoscedasticidad).
3. Los residuos siguen la distribución de probabilidad normal.
4. Las variables independientes no deben estar
correlacionadas entre sí (no debe existir multicolinealidad).
5. Los residuos son independientes. Las observaciones
sucesivas de la variable dependiente no están
correlacionadas.

También podría gustarte

Documento Teoria Del Numero
0% (2)
Documento Teoria Del Numero
72 páginas
PROBLEMAS
Aún no hay calificaciones
PROBLEMAS
26 páginas
Pia Pam
Aún no hay calificaciones
Pia Pam
12 páginas
Ejercicios Estadística
Aún no hay calificaciones
Ejercicios Estadística
3 páginas
Taller 2.
33% (3)
Taller 2.
2 páginas
Variables y Distribuciones Probabilísticas
Aún no hay calificaciones
Variables y Distribuciones Probabilísticas
8 páginas
PAE Tarea3 C7 Grupo G3 Distrib Prob Discreta
Aún no hay calificaciones
PAE Tarea3 C7 Grupo G3 Distrib Prob Discreta
25 páginas
Análisis de Varianza y Pruebas F
Aún no hay calificaciones
Análisis de Varianza y Pruebas F
4 páginas
Taller 4
Aún no hay calificaciones
Taller 4
6 páginas
Caso Final Practico Compañia Ilusiones
Aún no hay calificaciones
Caso Final Practico Compañia Ilusiones
13 páginas
Unidad Didactica-Financiera 21-22
Aún no hay calificaciones
Unidad Didactica-Financiera 21-22
162 páginas
Deber Tributaria 1
0% (1)
Deber Tributaria 1
17 páginas
Deber para Ya
Aún no hay calificaciones
Deber para Ya
18 páginas
Probabilidades en Distribuciones Poisson
Aún no hay calificaciones
Probabilidades en Distribuciones Poisson
4 páginas
Entrega de Trabajo de Estadística Inferencial
Aún no hay calificaciones
Entrega de Trabajo de Estadística Inferencial
44 páginas
Ejercicios de Prueba de Hipótesis para Dos Medias Con Muestras Grandes. III 2022.
Aún no hay calificaciones
Ejercicios de Prueba de Hipótesis para Dos Medias Con Muestras Grandes. III 2022.
8 páginas
Preparacion e Inferencial
Aún no hay calificaciones
Preparacion e Inferencial
32 páginas
Correlación Gasto-Votos en Campañas
20% (5)
Correlación Gasto-Votos en Campañas
1 página
Practica 1
Aún no hay calificaciones
Practica 1
5 páginas
Trabajo Grupal No 1 - Estadistica Inferencial
Aún no hay calificaciones
Trabajo Grupal No 1 - Estadistica Inferencial
29 páginas
Grupo1 PrimerTrabajoGrupal Compressed
100% (1)
Grupo1 PrimerTrabajoGrupal Compressed
26 páginas
Ejercicios de DISTRIBUCIONES MUESTRAL de Proporciones
Aún no hay calificaciones
Ejercicios de DISTRIBUCIONES MUESTRAL de Proporciones
5 páginas
EJERCICIOS CAP 7 Estadistica
Aún no hay calificaciones
EJERCICIOS CAP 7 Estadistica
3 páginas
TAREA1
100% (1)
TAREA1
5 páginas
Taller 3
Aún no hay calificaciones
Taller 3
11 páginas
Ejercicios de Frontera de Posibilidades de Producción
Aún no hay calificaciones
Ejercicios de Frontera de Posibilidades de Producción
5 páginas
Ejercicios Resueltos de Capitulo 13 (Correlacion) 2 Problemas
Aún no hay calificaciones
Ejercicios Resueltos de Capitulo 13 (Correlacion) 2 Problemas
7 páginas
Pae 6
Aún no hay calificaciones
Pae 6
6 páginas
Archivodiapositiva 202211136134
Aún no hay calificaciones
Archivodiapositiva 202211136134
38 páginas
Base Deberes Estadistica Cap 9
0% (1)
Base Deberes Estadistica Cap 9
10 páginas
Análisis de Regresión en Ventas
Aún no hay calificaciones
Análisis de Regresión en Ventas
9 páginas
Estadistica 23
Aún no hay calificaciones
Estadistica 23
5 páginas
1 - Cap 6-7-8-9 Estad - Infer 23 Mayo 2022
Aún no hay calificaciones
1 - Cap 6-7-8-9 Estad - Infer 23 Mayo 2022
41 páginas
Instructivo de Matemática Financiera
Aún no hay calificaciones
Instructivo de Matemática Financiera
12 páginas
Tarea N1 (Estadistica Inferencial)
Aún no hay calificaciones
Tarea N1 (Estadistica Inferencial)
14 páginas
Capitulo 7
0% (1)
Capitulo 7
10 páginas
Prueba de Hipótesis Media 2
Aún no hay calificaciones
Prueba de Hipótesis Media 2
11 páginas
Prueba Estadística de Llenado de Botellas
50% (4)
Prueba Estadística de Llenado de Botellas
4 páginas
EVIDENCIA 4 - Estadistica
Aún no hay calificaciones
EVIDENCIA 4 - Estadistica
6 páginas
Guia de Mate III Chida-Machin
0% (9)
Guia de Mate III Chida-Machin
12 páginas
Contabilidad Corporativa Corregido
Aún no hay calificaciones
Contabilidad Corporativa Corregido
14 páginas
Ejercicios para Repasar
0% (1)
Ejercicios para Repasar
1 página
Guia Practica ANOVA
0% (2)
Guia Practica ANOVA
5 páginas
Análisis Estadístico de Hipótesis
Aún no hay calificaciones
Análisis Estadístico de Hipótesis
8 páginas
Actividad 1 Estadística Aplicada
Aún no hay calificaciones
Actividad 1 Estadística Aplicada
40 páginas
Análisis de Regresión y Correlación en Datos Muestrales
Aún no hay calificaciones
Análisis de Regresión y Correlación en Datos Muestrales
53 páginas
A7 JLLC
100% (1)
A7 JLLC
6 páginas
Análisis de Correlación en Ventas y Producción
Aún no hay calificaciones
Análisis de Correlación en Ventas y Producción
18 páginas
Pregunta 6
0% (2)
Pregunta 6
1 página
Talller de Distribucion Norml
Aún no hay calificaciones
Talller de Distribucion Norml
6 páginas
Cuestionario No 1
100% (1)
Cuestionario No 1
1 página
Análisis Estadístico de Firmas Contables
Aún no hay calificaciones
Análisis Estadístico de Firmas Contables
1 página
Análisis Estadístico de Hipótesis y ANOVA
67% (3)
Análisis Estadístico de Hipótesis y ANOVA
4 páginas
Ejercicios de Estadística Descriptiva
Aún no hay calificaciones
Ejercicios de Estadística Descriptiva
7 páginas
Calculos Definitivos Liquidaciones
Aún no hay calificaciones
Calculos Definitivos Liquidaciones
11 páginas
Regresión Lineal
100% (1)
Regresión Lineal
18 páginas
A2 TGV
Aún no hay calificaciones
A2 TGV
11 páginas
Regresión Lineal y Correlación
Aún no hay calificaciones
Regresión Lineal y Correlación
40 páginas
Cuarta Clase Unac 2021
0% (1)
Cuarta Clase Unac 2021
28 páginas
Clase10 Regresión
Aún no hay calificaciones
Clase10 Regresión
37 páginas
Equilibrio en Sistemas Mecánicos
Aún no hay calificaciones
Equilibrio en Sistemas Mecánicos
24 páginas
Flujo Plastico
100% (2)
Flujo Plastico
24 páginas
Cuestionario Sobre Sistema de Riego
100% (1)
Cuestionario Sobre Sistema de Riego
5 páginas
Ensayo de Perdida de Carga
Aún no hay calificaciones
Ensayo de Perdida de Carga
4 páginas
Técnicas de Levantamiento Batimétrico
Aún no hay calificaciones
Técnicas de Levantamiento Batimétrico
8 páginas
Preguntas de Topo Ii
Aún no hay calificaciones
Preguntas de Topo Ii
5 páginas
Expo - Muelles de Cajones-1
Aún no hay calificaciones
Expo - Muelles de Cajones-1
21 páginas
Informe de Presentacion
100% (1)
Informe de Presentacion
5 páginas
Quehua
Aún no hay calificaciones
Quehua
3 páginas
Desarrolo Personal
Aún no hay calificaciones
Desarrolo Personal
6 páginas
Bases Del Concurso de Maquetas
Aún no hay calificaciones
Bases Del Concurso de Maquetas
3 páginas
Medidas de Tendencia Central
Aún no hay calificaciones
Medidas de Tendencia Central
15 páginas
EJERCICIOS CAPITULO 10 Pag 347
Aún no hay calificaciones
EJERCICIOS CAPITULO 10 Pag 347
2 páginas
Wilcoxon y Mann Whitney
100% (2)
Wilcoxon y Mann Whitney
11 páginas
Ejercicio 6 DOE 3K
Aún no hay calificaciones
Ejercicio 6 DOE 3K
62 páginas
Ejercicios Propuestos Muestreo
Aún no hay calificaciones
Ejercicios Propuestos Muestreo
6 páginas
Ejercicios-Resueltos Medidas de Dispersion (II)
100% (4)
Ejercicios-Resueltos Medidas de Dispersion (II)
3 páginas
Panel de Datos (C.practico) - Kevinn Piñas Eulogio
Aún no hay calificaciones
Panel de Datos (C.practico) - Kevinn Piñas Eulogio
16 páginas
S2 T1 Estimación de Intervalos para El Cociente de Varianzas y Diferencia de Medias
Aún no hay calificaciones
S2 T1 Estimación de Intervalos para El Cociente de Varianzas y Diferencia de Medias
18 páginas
Análisis Paramétrico y No Paramétrico
Aún no hay calificaciones
Análisis Paramétrico y No Paramétrico
14 páginas
Análisis de Pruebas de Hipótesis en Ingeniería
Aún no hay calificaciones
Análisis de Pruebas de Hipótesis en Ingeniería
10 páginas
ProblemasSeccion3 2
Aún no hay calificaciones
ProblemasSeccion3 2
1 página
Ejercicios 2.3.1-2.3.5.
Aún no hay calificaciones
Ejercicios 2.3.1-2.3.5.
30 páginas
Ejercicios Estadística
Aún no hay calificaciones
Ejercicios Estadística
4 páginas
Contraste de Hipótesis y Significación
Aún no hay calificaciones
Contraste de Hipótesis y Significación
2 páginas
Castro García
Aún no hay calificaciones
Castro García
24 páginas
Tablas y Gráficos de Frecuencia
Aún no hay calificaciones
Tablas y Gráficos de Frecuencia
9 páginas
Inferencia Estadistica
Aún no hay calificaciones
Inferencia Estadistica
236 páginas
Análisis Estadístico de Datos de Encuesta
Aún no hay calificaciones
Análisis Estadístico de Datos de Encuesta
11 páginas
Problemario 1 Danny
Aún no hay calificaciones
Problemario 1 Danny
5 páginas
Taller de Estadística - Rolando Arturo Diaz Larios
Aún no hay calificaciones
Taller de Estadística - Rolando Arturo Diaz Larios
7 páginas
Perímetro Cefálico
Aún no hay calificaciones
Perímetro Cefálico
3 páginas
Hipótesis para La Diferencia de Dos Medias Poblacionales
Aún no hay calificaciones
Hipótesis para La Diferencia de Dos Medias Poblacionales
22 páginas
Semana 3 Sesión 1 - Solucionario
100% (1)
Semana 3 Sesión 1 - Solucionario
21 páginas
Consulta de La Unidad 5. Analisis de Regresión y Correlación Múltiples
Aún no hay calificaciones
Consulta de La Unidad 5. Analisis de Regresión y Correlación Múltiples
19 páginas
Intervalos de Confianza en Estadística
Aún no hay calificaciones
Intervalos de Confianza en Estadística
5 páginas
Ejercicios Integradores para Primer Parcial
Aún no hay calificaciones
Ejercicios Integradores para Primer Parcial
7 páginas
Introducción a la Bioestadística
Aún no hay calificaciones
Introducción a la Bioestadística
262 páginas
Mapa Mental
Aún no hay calificaciones
Mapa Mental
1 página
Escala de Autoestima de Rosenberg
Aún no hay calificaciones
Escala de Autoestima de Rosenberg
10 páginas
EjercicioS EXCEL 5-6
Aún no hay calificaciones
EjercicioS EXCEL 5-6
16 páginas