[go: up one dir, main page]

0% encontró este documento útil (0 votos)
12 vistas108 páginas

Pronosticos de La Demanda

El documento aborda la importancia de los pronósticos de demanda en la planificación empresarial, destacando su rol en la toma de decisiones a corto, mediano y largo plazo. Se diferencian los pronósticos extrínsecos e intrínsecos, así como los métodos cualitativos y cuantitativos para realizarlos. Además, se discuten factores que afectan la demanda y la precisión de los pronósticos en relación con datos reales.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
12 vistas108 páginas

Pronosticos de La Demanda

El documento aborda la importancia de los pronósticos de demanda en la planificación empresarial, destacando su rol en la toma de decisiones a corto, mediano y largo plazo. Se diferencian los pronósticos extrínsecos e intrínsecos, así como los métodos cualitativos y cuantitativos para realizarlos. Además, se discuten factores que afectan la demanda y la precisión de los pronósticos en relación con datos reales.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 108

Pronósticos de la Demanda

1
PRONOSTICOS
 Pronosticar es el arte de especificar
información significativa acerca del futuro.
 Las decisiones relativas a la planeación a
largo plazo exigen que se consideren
muchos factores:
 las condiciones económicas
prevalecientes a nivel general,
 las tendencias en la industria,
 las acciones probables de los
competidores,
 las condiciones del entorno político en
general, etc.
2
PRONOSTICOS (continuación)
 Los pronósticos extrínsecos se formulan en
función de asociaciones externas, por
ejemplo, entre las ventas de aparatos
electrodomésticos y el ingreso personal
disponible.
 Los pronósticos intrínsecos sirven para
planear la producción y se formulan en
forma individual para cada artículo.
3
PRONOSTICOS (continuación)
Un pronóstico es un cálculo de la actividad
futura. Puede ser una predicción sobre:
 la aceptación de un nuevo producto,
 los cambios de la demanda,
 los inventarios,
 u otras condiciones que influyen
directamente en la planeación de la
producción.
4
PRONOSTICOS (continuación)
Pronosticar es el arte y la ciencia de
predecir los eventos del futuro.
 Hasta la década de los 70´s, los pronósticos
eran, en su gran mayoría, un arte.
 Ahora también son una ciencia. Aunque
aún se necesita del juicio gerencial para
pronosticar, el gerente tiene herramientas y
métodos matemáticos sofisticados.
5
PERIODO DE LOS PRONOSTICOS
 A Corto Plazo (hasta 6 meses), sirven de parámetros
para las operaciones en curso (productos
específicos, volumen de inventario, tipos de
habilidades y mano de obra, capacidad de
máquina).
 A Mediano Plazo (entre seis meses y dos años),
sirven de apoyo para la planeación agregada
(grupo de productos, capacidades
departamentales).
 A Largo Plazo (más de dos años), sirven de apoyo
para las decisiones acerca de:
 ubicación y capacidad de la planta,
 ampliación de las instalaciones,
 selección de nueva tecnología y procesos
productivos,
 adopción de nuevas líneas de productos, etc.

6
PRECISION DE LOS
PRONOSTICOS
La precisión del pronóstico se refiere a lo
aproximado que los pronósticos resultan en
comparación con los datos reales.
Pronósticos por grupo o familia de
productos (más o menos precisos).
Pronósticos de artículo por separado
(menos precisos)
7
MARCO CONCEPTUAL DE
LOS PRONOSTICOS
Aquí nos enfocaremos en el pronóstico de
la demanda de producción. Demanda y
ventas no siempre son iguales:
 Si la demanda no se limita por la
capacidad o por políticas, el pronóstico
de ésta será el mismo que el pronóstico
de ventas.
 En caso contrario, las ventas podrían ser
ligeramente inferiores a la demanda de
los clientes.
8
MARCO CONCEPTUAL DE
LOS PRONOSTICOS (cont.)
Es necesario aclarar la diferencia
entre pronóstico y planeación:
 Los pronósticos se refieren a lo que se cree
que sucederá en el futuro.
 La planeación se refiere a lo que se
considera que debería suceder en el futuro.

9
MARCO CONCEPTUAL DE
LOS PRONOSTICOS (cont.)
 Los pronósticos son un insumo para todos los
tipos de planeación y control empresarial, tanto
dentro como fuera de la función de operaciones.
 Mercadotecnia los usa para planear los
productos, la promoción y los precios.
 Finanzas los utiliza como insumos para la
planeación financiera.
 Operaciones los usa como insumo para la toma
de decisiones sobre: diseño de proceso,
planeación de la capacidad, estimación de
los niveles de inventarios, etc.
10
ADMINISTRACIÓN DE LA DEMANDA
Demanda Independiente

A Demanda Dependiente

B(4) C(2)

D(2) E(1) D(3) F(2)

11
FACTORES QUE AFECTAN LA
DEMANDA
 Factores Externos:
 Una economía floreciente, logra influir positivamente en la
demanda, aun cuando sus efectos pueden no ser iguales para
todos los productos y servicios.
 Ciertas actividades económicas, como los cambios en las
reglamentaciones de un gobierno, afectan a algunos productos,
pero no a otros.
 Factores Internos, los cuales tienen que ver con las
decisiones sobre:
 Diseño de productos o servicios.
 Determinación de los volúmenes de inventario.
 La fijación de precios y las promociones publicitarias.
 El diseño de envases.
 Los incentivos para el personal de ventas.
 La expansión o contracción de las áreas geográficas
seleccionadas como objetivo de mercado.
12
METODOS DE PRONOSTICOS
• METODOS CUALITATIVOS
– Delphi
– Estudio de Mercados
– Analogía de los Ciclos de Vida
– Juicio Informado
• METODOS CUANTITATIVOS
– Pronósticos por Series de Tiempo
» Promedio Simple Promedio móvil Simple
» Promedio Móvil Promedio Móvil Ponderado
» Suavización Exponencial
» Análisis de Regresión Promedio Móvil Centrado
» Modelos Matemáticos
» Box Jenkins
– Modelos Causales de Pronósticos
» Análisis de Regresión
» Modelos Econométricos
» Modelo de Insumo - Producto
» Indicadores Anticipados
--Modelos de Simulación
13
METODOS DE
PRONOSTICOS (continuac.)
Para pronósticos de planeación de la
producción y de inventarios, un sistema de
pronóstico “satisfactorio” presenta las
siguientes características:
 Precisión
 Pocos requisitos en cuanto al tiempo para hacer
cálculos.
 Escasas necesidades de almacenamiento en
computadora.
 Costos bajos en la compra o el desarrollo de programas.
 Capacidad en línea.
 Capacidad para enlazarse con un sistema de
administración de base de datos existente.
14
MÉTODOS CUALITATIVOS DE
PRONÓSTICOS
 Como ya se indicó, los métodos cualitativos
de pronósticos utilizan el juicio de los
gerentes, su experiencia, los datos
relevantes y un modelo matemático
implícito.
 Como el modelo es implícito, si dos
gerentes distintos utilizan los métodos
cualitativos, es frecuente que lleguen a
pronósticos con variaciones importantes.
15
MÉTODOS DE PRONÓSTICOS
CUALITATIVOS

1. Método Delphi *
2. Estudios de Mercado *
3. Analogía de los Ciclos de Vida *
4. Juicio Informado *

16
1. Método de Delphi
 Descripción: Pronóstico desarrollado mediante un
grupo de expertos que responden preguntas en
rondas sucesivas. Las respuestas anónimas del
grupo retroalimentan en cada ronda a todos los
participantes. Se pueden usar entre tres y seis
rondas para lograr un consenso sobre el
pronóstico.
 Usos: Pronósticos de ventas a largo plazo para
planeación de capacidad o instalaciones.
Pronósticos tecnológicos para evaluar cuando
pueden presentarse los cambios tecnológicos.
 Exactitud: Regular a muy buena en el corto,
mediano y largo plazo.

17
Delphi Method
1. Choose the experts to participate. There should be a
variety of knowledgeable people in different areas.

2. Through a questionnaire (or E-mail), obtain forecasts (and


any premises or qualifications for the forecasts) from all
participants.

3. Summarize the results and redistribute them to the


participants along with appropriate new questions.

4. Summarize again, refining forecasts and conditions, and


again develop new questions.

5. Repeat Step 4 if necessary. Distribute the final results to


all participants. *
18
2. Estudios de Mercado
 Descripción: Grupos, cuestionarios, pruebas de
mercado o estudios que se usan para obtener datos
sobre las condiciones del mercado.
 Usos: Pronósticos de las ventas totales de la
compañía, de grupos de productos importantes o
de productos individuales.
 Exactitud: Muy buena en el corto plazo. Buena
en el mediano plazo. Regular en el largo plazo.
*

19
3. Analogía de los Ciclos de
Vida
 Descripción: Predicción basada en la fase de
introducción, crecimiento y saturación de
productos similares. Aprovecha la curva de
crecimiento de las ventas en forma de S.
 Usos: Pronósticos de ventas a largo plazo para
planeación de capacidad o instalaciones.
 Exactitud: Mala en el corto plazo. Regular a
buena en el mediano plazo. Regular a buena en el
largo plazo.
*

20
4. Juicio Informado
 Descripción: Pronóstico que puede hacer un
grupo o un individuo basándose en sus
experiencias, intuición o hechos relacionados con
la situación. No se usa un método riguroso.
 Usos: Pronósticos de ventas totales y de productos
individuales.
 Exactitud: Mala a regular en el corto, mediano y
largo plazo.

21
TIME SERIES ANALYSIS
Pick a model based on:

1. Time horizon to forecast


2. Data availability
3. Accuracy required
4. Size of forecasting budget
5. Availability of qualified personnel

22
SERIE DE TIEMPO
Las observaciones repetidas de
la demanda de un producto o
servicio, tomando como base el
orden en que se realizan,
forman un patrón que se conoce
como serie de tiempo.
23
PRONÓSTICOS POR SERIES
DE TIEMPO
La expresión que se emplea más comúnmente para
un pronóstico por series de tiempo es:

Y TCSR
En donde: Y = valor pronosticado.
T = tendencia básica.
C = variaciones cíclicas alrededor
de la tendencia.
S = variaciones de estacionalidad
dentro de la tendencia.
R = variaciones residuales o restantes sin
explicar.
24
PRONÓSTICOS POR SERIES
DE TIEMPO (continuación)
Otro ejemplo de la descomposición de una serie de
tiempo es el siguiente:

y (t ) (a  bt ) f (t )  e
en donde: y(t) = demanda durante el periodo t
a = nivel
b = tendencia
f(t) = factor de estacionalidad (multiplicativo)
e = error aleatorio
25
COMPONENTES DE UNA
SERIE DE TIEMPO
Demanda
Serie de tiempo
original

Tiempo

Demanda Ciclo
Patrón de
estacionalidad
Tendencia

Nivel
Error Aleatorio
Tiempo
26
PRONÓSTICOS POR SERIES
DE TIEMPO
»Promedio Simple *
Promedio móvil Simple *
»Promedio Móvil Promedio Móvil Ponderado *
Promedio Móvil Centrado
»Suavización Exponencial *
*
»Análisis de Regresión
*
»Modelos Matemáticos
»Box Jenkins
27
PROMEDIO SIMPLE
 Cuando b en la ecuación de la recta Y = a + bX es
igual a cero, la recta es horizontal. El pronóstico
para el siguiente periodo se convierte entonces en
el promedio simple de todos los valores de Y
hasta la fecha: N

 Yi
Yf  i 1
N
 El cálculo de un promedio simple para el
pronóstico de tendencia es entonces un caso
especial del método de mínimo cuadrados.
28
PROMEDIO SIMPLE EJEMPLO
• Dados los datos de consumos de los trimestres de
cada año, entre 2.010 y 2.014 de una determinada
materia prima, se requiere el pronóstico
trimestral para el año 2.015.

29
PROMEDIO SIMPLE EJEMPLO

30
PROMEDIO SIMPLE EJEMPLO
(continuación)
Promedio Simple Anual Discriminado por Trimestre
480
460
440
420
400
380
360 T1
T2
Demanda

340
T3
320 T4
300
280
260
240
220
200
180
160
1 2 3 4 5
Años
31
PROMEDIO SIMPLE EJEMPLO
(continuación)

Promedio Simple Anual Discriminado por Trimestre


480
460
440
420
400
T1
380 Linear ( T1)
T2
360
Linear ( T2)
Demanda

340 T3
320 Linear ( T3)
Linear ( T3)
300
T4
280 Linear ( T4)
TT1
260 TT2
TT3
240 TT4
220
200
180

Años
160
1 2 3 4 5

32
PROMEDIO SIMPLE EJEMPLO
(continuación)
Índices de Estacionalidad:

272 300
I T1  294,5 0,92 I T3  294,5 1,02
404 202
I T2  294,5 1,37 I T4 294,5
 0 , 69

33
PROMEDIO SIMPLE EJEMPLO
(continuación)
Aplicando el pronóstico de línea recta para
2.015 para la ecuación de la recta
Y = a + bX, se tiene
n n

Y
i 1
i  Na  b Xi
i 1
n n n

XY
i 1
i i a  X i  b X
i 1 i 1
i
2

34
PROMEDIO SIMPLE EJEMPLO
(continuación)
En la siguiente tabla se hace un cálculo de las sumatorias
anteriores y los resultados se llevan a las dos últimas
ecuaciones vistas.
AÑO Y * X X2 XY
2.010 1080 0 0 0
2.011 1190 1 1 1190
2.012 1100 2 4 2200
2.013 1220 3 9 3660
2.014 1300 4 16 5200
Sumas 5890 10 30 12250
* Los valores de Y están dados en unidades.

35
PROMEDIO SIMPLE EJEMPLO
(continuación)
Reemplazando los resultados de las sumatorias en las
ecuaciones tenemos:
5890 = 5a +10b
12250 = 10a + 30b
Resolviendo estas dos ecuaciones simultáneamente se tiene

Llevando estos valores a la ecuación de la recta tenemos:


Y = 1.084 + 47X
para X = 5, correspondiente al 2.015, se tiene que
Y = 1.319, lo cual será el pronóstico para ese año.
36
PROMEDIO SIMPLE EJEMPLO
(continuación)
Aplicando los índices de estacionalidad se tiene:
1.319
F T 1  4 0,92 303
1.319
F T 2  4 1,37 452
1.319
F T 3  4 1,02 336
1.319
F T 4  4 0,69 228
....................Total .. 1.319  pronostico _ de
la _ tendencia _ para _ el _ 2.015 *
37
SIMPLE MOVING AVERAGE
Dt + D t-1 + D t-2 +...+D t-n+1
At =
n
F t 1  At
 Let’sdevelop 3-week and
6-week moving average
forecasts for demand.
 Assume you only have 3
weeks and 6 weeks of
actual demand data for the
respective forecasts 38
SOLUTION
Week Demand 3-Week 6-Week
1 650
2 678
3 720
4 785 682,67
5 859 727,67
6 920 788,00
7 850 854,67 768,67
8 758 876,33 802,00
9 892 842,67 815,33
10 920 833,33 844,00
11 789 856,67 866,50
12 844 867,00 854,83
39
1000 SIMPLE MOVING AVERAGE GRAPHIC
950
900
850
Demand

800 Demand
3-Week
750 6-Week

700
650
600
1 2 3 4 5 6 7 8 9 10 11 12
Week
40
In-Class Exercise

 Develop 3-week and


5-week moving
average forecasts for
demand.
 Assume you only
have 3 weeks and 5
weeks of actual
demand data for the
respective forecasts
41
In-Class Exercise (Solution)

*
42
WEIGHTED MOVING AVERAGE
F t 1
 At W 1 Dt  W 2 Dt  1 ...W N Dt  N 1
N

With the condition that  W 1


i 1
i

Determine the 3-period


weighted moving average
forecast for period t = 4.
Weights:
t-1 0.5
t-2 0.3
t-3 0.2
43
Solution

F4 = 0.5(720) + 0.3(678) + 0.2(650)


44
In-Class Exercise

Determine the 3-period


weighted moving average
forecast for period 5.

Weights:
t-1 0.7
t-2 0.2
t-3 0.1
45
Solution

713

* 46
PROMEDIO MÓVIL CENTRADO

47
PROMEDIO MÓVIL CENTRADO

Prono
48
INDICES

Anterior a b
49
El paso final es hacer un pronóstico, el cual se
lleva a cabo tomando el producto del promedio
móvil centrado más reciente y su propio índice
Temporal ajustado. Para los dos primeros
trimestres del año 2.015, se tiene:

T12.015= 276 x 0,934 = 257,78 unidades

T22.015 = 274 x 1,340 = 367,16 unidades


Anterior *
50
EXPONENTIAL SMOOTHING
Para 0 ≤ a ≤ 1, se tiene:
At =  Dt + (1- )At-1
Ft+1 = At
Ft+1 =  Dt + (1-  )Ft
Ft+1 = Ft + (Dt - Ft)
 Premise--The most recent observations might
have the highest predictive value.
 Therefore, we should give more weight to the
more recent time periods when forecasting 51
Exponential Smoothing Example
 Determine
exponential
smoothing forecasts
for periods 2-10
using  =0.10 and

=0.60.

 Let F1=D1
52
SOLUTION

Week Demand 0.1 0.6


1 820 820.00 820.00
2 775 820.00 820.00
3 680 815.50 793.00
4 655 801.95 725.20
5 750 787.26 683.08
6 802 783.53 723.23
7 798 785.38 770.49
8 689 786.64 787.00
9 775 776.88 728.20
10 776.69 756.28
53
Effect of  on Forecast

Exponential Smoothing Graphic


840

820

800

780
Series1 = Demanda
Demanda

760
Series2 = a = 0,6

740 Series3 = a = 0,1

720

700

680

660

640
1 2 3 4 5 6 7 8 9
Tiempo
54
In-Class Exercise

Determine exponential
smoothing forecasts for
periods 2-5 using 
=.50

Let F1=D1

55
In-Class Exercise (Solution)

56
ERRORES DE
PRONÓSTICOS
MAD (Desviación Absoluta Promedio o
Mean Absolute Deviation )

Señal de Rastreo (Tracking Signal)

57
MAD (Desviación Absoluta Promedio
o Mean Absolute Deviation )

La Desviación Absoluta Promedio se representa así:

58
Example MAD
Month Sales Forecast
1 220 n/a
2 250 255
3 210 205
4 300 320
5 325 315

Determine the MAD for the four forecast periods


59
Solution
Month Sales Forecast Abs Error
1 220 n/a
2 250 255 5
3 210 205 5
4 300 320 20
5 325 315 10

40

60
Señal de Rastreo (Tracking Signal)
suma _ acumulada _ de _ la _ desviacion _ del _ pronostico
Señal _ de _ rastreo TS 
MAD

RSFE Running sum of forecast errors


TS = =
MAD Mean absolute deviation

Señal _ de _ rastreo TS 


 D  F t t
MAD
 Is the forecast average keeping pace with any
genuine upward or downward changes?
61
Con base en la siguiente información, determine la señal de rastreo

a b
62
Con base en la siguiente información, determine los pronósticos,
las MAD y la señales de rastreo TS

a b
63
Modelos Causales de Pronósticos

Análisis de Regresión
Modelos Econométricos
Modelo de Insumo - Producto
Indicadores Anticipados

64
INTRODUCCIÓN A LA REGRESIÓN LINEAL SIMPLE
En la práctica, es frecuente que se requiera resolver
problemas que implican conjuntos de variables de las cuales
se sabe que tienen alguna relación inherente entre sí.
Por ejemplo, en una situación industrial quizá se sepa que el
contenido de alquitrán en la corriente de salida de un proceso
químico está relacionado con la temperatura en la entrada.
Podría ser de interés desarrollar un método de pronóstico, es
decir, un procedimiento para estimar el contenido de
alquitrán de varios combustibles teniendo en cuenta la
temperatura de entrada, a partir de información
experimental. Por supuesto, es muy probable que para
muchos ejemplos concretos en los que la temperatura de
entrada sea la misma, por ejemplo 130 °C, el contenido de
alquitrán a la salida no sea el mismo.
63
El contenido de alquitrán es una variable dependiente o
de respuesta. La temperatura en la entrada es una
variable independiente o regresor. Una forma
razonable de relación entre la respuesta Y y el regresor
X es la relación lineal donde, por supuesto, α es la
intersección con el eje Y y β es la pendiente. La
relación se ilustra en la figura 1.

64
Relaciones entre variables y regresión
• El término regresión fue introducido por Galton en su libro
“Natural inheritance” (1889) refiriéndose a la “ley de la
regresión universal”:

– “Cada peculiaridad en un hombre es compartida por sus


descendientes, pero en media, en un grado menor.”
• Regresión a la media
– Su trabajo se centraba en la descripción de los rasgos físicos
de los descendientes (una variable) a partir de los de sus
padres (otra variable).
– Pearson (un amigo suyo) realizó un estudio con más de 1000
registros de grupos familiares observando una relación del
tipo: Francis Galton
• Altura del hijo = 85cm + 0,5 altura del padre (aprox.) • Primo de Darwin
• Conclusión: los padres muy altos tienen tendencia a • Estadístico y
tener hijos que heredan parte de esta altura, aunque aventurero
tienen tendencia a acercarse (regresar) a la media. Lo • Fundador (con
mismo puede decirse de los padres muy bajos, tienden a otros) de la
tener hijos más altos. estadística moderna
para explicar las
• Hoy en día el sentido de regresión es el de predicción de una teorías de Darwin.
medida basándonos en el conocimiento de otra.

65
Estudio conjunto de dos variables
• A la derecha tenemos una posible manera de recoger los datos,
observando dos variables en varios individuos de una muestra.

– En cada fila tenemos los datos de un individuo Altura


en Peso
cm. en Kg.
– Cada columna representa los valores que toma una variable sobre
los mismos. 162 61
154 60
– Las individuos no se muestran en ningún orden particular. 180 78
158 62
• Dichas observaciones pueden ser representadas en un 171 66
diagrama de dispersión (‘scatterplot’). En ellos, cada
individuos es un punto cuyas coordenadas son los valores de 169 60
las variables. 166 54
176 84
• Nuestro objetivo será intentar reconocer a partir del diagrama 163 68
de dispersión, si hay relación entre las variables, de qué tipo, y ... ...
si es posible predecir el valor de una de ellas en función de la
otra.

66
Diagramas de dispersión o nube de puntos
Tenemos las alturas X y los pesos Y de 30 individuos
representados en un diagrama de dispersión.

Pesa 76 kg.

Mide 187 cm.


Pesa 50 kg.

Mide 161 cm.

67
Relación entre variables.
Tenemos las alturas X y los pesos Y de 30 individuos
representados en un diagrama de dispersión.

l a
n
co
nta
me
au
e so
el p
que
eec
r
Pa r a
u
al t

68
Predicción de una variable en función de la
otra.
Aparentemente el peso aumenta 10Kg por cada 10 cm de
altura... o sea, el peso aumenta en una unidad por cada
unidad de altura.
100
90
80
70
60 10 kg.

50
40 10 cm.
30
140 150 160 170 180 190 200
69
Cómo reconocer relación directa e inversa.
330 100

280 Incorrelación 90 Fuerte relación


80 directa.
230
70
180
60
130 50

80 40
30
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200
• Para los valores de X
Para valores de X por encima de la
media tenemos valores de Y por mayores que la media le
encima y por debajo en proporciones corresponden valores de Y
similares. Incorrelación. mayores también.

• Para los valores de X


menores que la media le
corresponden valores de Y
menores también.

• Esto se llama relación


directa o creciente entre X e
Y. de X mayores que la
Para los valores
media le corresponden valores de Y
menores. Esto es relación inversa o
decreciente.
70
Cómo reconocer buena o mala relación
330 100

Poca relación 90 Fuerte relación


280
80 directa.
230
70
180 60
130 50

80 40
30
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200

• Dado un valor de X no • Conocido X sabemos


podemos decir gran cosa que Y se mueve por
sobre Y. Mala relación. una horquilla estrecha.
Independencia. Buena relación.
• Lo de “horquilla
estrecha” hay que
entenderlo con respecto
a la dispersión que tiene
la variable Y por si sola,
cuando no se considera
X. 71
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o
inversa. n
1
– Directa: Sxy > 0
– Inversa: Sxy < 0
S xy   xi  x y i  y 
n i 1
– Incorreladas: Sxy = 0

• El signo de la covarianza nos dice si el aspecto de la


nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relación entre las variables.

72
Coef. de correlación lineal de Pearson
• El coeficiente de correlación lineal de Pearson de
dos variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente (excluyendo
rectas horizontales y verticales).

• tiene el mismo signo que Sxy por tanto de su signo


obtenemos el que la posible relación sea directa o
inversa.

• r es útil para determinar si hay relación lineal entre


dos variables, pero no servirá para otro tipo de S xy
relaciones (cuadrática, logarítmica,...) r
2 S xx S yy
 
n
1
S xx   Xi  X
n i 1
2
1 n
S yy   Yi  Y
n i 1
 
1 n

S xy   X i  X Yi  Y
n i 1
  73
Propiedades de r
• Es adimensional
• Sólo toma valores entre [-1,1], es decir, -1 ≤ r ≤ 1
• Las variables son incorreladas  r = 0
• Relación lineal perfecta entre dos variables  r = +1 o r = -1
– Excluimos los casos de puntos alineados horizontalmente o verticalmente.
• Cuanto más cerca esté r de +1 ó -1, mejor será el grado de
relación lineal.
– Siempre que no existan observaciones anómalas.
Relación
inversa Relación
perfecta directa
Variables
incorreladas perfecta

-1 0 +1
74
Entrenando el ojo: correlaciones positivas

75
Entrenando el ojo: casi perfectas y positivas

100
90
80
70
60
50
40 r=0,99
30
140 150 160 170 180 190 200

100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200

76
Entrenando el ojo: correlaciones negativas

90
80
70
60
50
40
30
20
10 r=-0,5
0
140 150 160 170 180 190 200

80
70
60
50
40
30
20
10 r=-0,999
0
140 150 160 170 180 190 200

77
Preguntas frecuentes
• ¿Si r = 0, quiere decir eso que las variables son independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.

• Me ha salido r=1.2 ¿la relación es “super lineal”[sic]?


– ¿Super qué? Eso es un error de cálculo. Siempre debe
tomar un valor entre -1 y +1.

• ¿A partir de qué valores se considera que hay “buena relación


lineal”?
– Es difícil dar un valor concreto (mira los gráficos
anteriores). Para este curso digamos que si |r| > 0,7 hay
buena relación lineal y que si |r| > 0,4 hay cierta
relación (por decir algo... la cosa es un poco más
complicada: observaciones anómalas,...)

78
Regresión lineal simple

Si la relación es exacta, entonces se trata de una


determinista entre dos variables científicas. Sin embargo,
en los fenómenos científicos y de ingeniería, la relación no
es determinista (es decir, una X dada no siempre produce el
mismo valor de Y).
Como resultado, existen problemas importantes que son de
naturaleza probabilística, toda vez que la relación anterior
no puede considerarse exacta. El concepto de análisis de
regresión tiene que ver con encontrar la mejor relación
entre Y y X, al cuantificar la intensidad de dicha relación y
emplear métodos que permitan predecir los valores de la
respuesta ante valores dados del regresor x.
79
Regresión lineal simple
En muchas aplicaciones, habrá más de un regresor (es decir,
más de una variable independiente que ayude a explicar a
Y"). Por ejemplo, en el caso en que la respuesta es el precio
de una casa, se esperaría que el área construida y la edad de
ésta contribuyeran a la explicación del precio, por lo que en
este caso la estructura múltiple de la regresión podría
escribirse como

donde Y es el precio, x1 son los metros cuadrados y x2 es la


edad en años. Este es un problema con regresores múltiples.
El análisis resultante se denomina regresión múltiple.
En tanto que el análisis del caso con un solo regresor recibe el
nombre de regresión simple.
80
Regresión lineal simple

- El modelo para la regresión lineal es:


yi a  b xi   i i = 1,
2, ..., n
donde:
yi = valor de la variable dependiente en el
período i.
xi = Valor de la variable independiente en el
período i.
ei = Error aleatorio en el modelo.
a = ordenada de la recta que relaciona yi y
xi.
b = pendiente de la recta.
n = número de períodos de datos
disponibles. 83
Regresión lineal simple
Tendencia Rectilínea:
 Dentro los diversos criterios que podrían
seguirse para fijar la correlación
existente entre dos variables, vamos a
adoptar el más ampliamente usado,
conocido como criterio mínimo
cuadrático.
 Este criterio consiste en determinar, de
entre todas las rectas posibles, aquella en
la que el promedio de los cuadrados de
las distancias de los puntos Y´ a la recta
alcanza el valor mínimo.
82
Tendencia Rectilínea (cont.)
 El criterio mínimo cuadrático postula que la recta
que cumpla esta condición es la que mejor se
adapta al gráfico de dispersión y, por lo tanto, la
que expresa mejor dentro del tipo de relación
rectilínea, la correlación existente entre la variable
dependiente y la independiente.
Y’
$
Y = a + bX
Y’
La fórmula que
Y’ expresa este
L
Y’ criterio es:
Y’
L 
n
Y
i
'

 a  bX 
2

n
1
i 1

Puntaje 83
Tendencia Rectilínea (cont.)
 Derivando parcialmente respecto a a y b, la ecuación
(1), e igualando a cero, se obtienen la primera y
segunda ecuaciones normales, así:
L n
 2 Yi  a  bX i  0 2
n
Y '

 a  bX 
2 a i 1
L  i
1
n L n
 2 Yi  a  bX i X i 0
i 1
3
b i 1

 Simplificando estas
n dos ecuaciones
n se obtiene
na  b X i  Yi 4
i 1 i 1
n n n
a  X i  b X i2  Yi X i 5
i 1 i 1 i 1
84
Tendencia Rectilínea (cont.)
 Resolviendo simultáneamente las ecuaciones (4) y
(5), se tienen los resultados para a y b
respectivamente.
n n n n

 X Y '   X  X Y '
i
2
i i i i
a  i 1 i 1 i 1 i 1
2
;
n
 n 
n X i    Xi 
2

i 1  i 1 
n n n
n  X iY ' i   X Y ' i i
i 1 i 1 i 1
b 2
n n
 
n X i   Xi 
2

i 1  i 1  85
Regresión lineal simple
Para ajustar los datos de la mejor manera posible
a una línea recta se buscan valores para a y b
de tal forma que se minimice la suma de
cuadrados totales de la diferencia entre los
valores de la variable dependiente real y la
estimada por el modelo.
Esto se consigue utilizando las siguientes
fórmulas para el cálculo de a y b:

88
Ejemplo numérico 1

yi = Número de accesorios vendidos en el


mes i. 89
x = Número de permisos emitidos en el mes
Solución ejemplo numérico

Gráfico hecho con la


herramienta “X-Y
plot...” en la opción
“Scatterplots” del
submenú “plot” de
Excel.

Las siguientes
tablas se
obtuvieron con
la opción
“simple
regresión” del
submenú
“relate” de
Excel.

90
Regression Equation Example

Develop a regression equation to predict sales


based on these five points.
89
SOLUTION
Week Week*Week Sales Week*Sales
1 1 150 150
2 4 157 314
3 9 162 486
4 16 166 664
5 25 177 885
Sum 15 Sum 55 Sum 812 Sum 2499

a=
 x
2
 y   x  xy
=
55 * 812 - 15 * 2499
143.5
n  x   x
2
2
5 * 55 - 15 * 15

b=
n  xy  x  y
=
5 * 2499 - 15 * 812
6.3
n  x   x
2
2
5 * 55 - 15 * 15
90
GRAPHIC
y = 143.5 + 6.3t
180
175
170
165
160 Sales
Sales

155 Forecast
150
145
140
135
1 2 3 4 5

Period
91
EJEMPLO
Suponga que nos interesa estimar la demanda de periódicos basándonos en la
población local. En la siguiente tabla se muestra la demanda de periódicos
durante los último 8 años y la población correspondiente de una ciudad
pequeña.
AÑO DEMANDA POBLACION
1 3.0 2.0
2 3.5 2.4
3 4.1 2.8
4 4.4 3.0
5 5.0 3.2
6 5.7 3.6
7 6.4 3.8
8 7.0 4.0
92
POBLACION PROYECTADA PARA EL AÑO 9
2
X (Años) Y (Población) X XY
1 2.0 1 2.0
2 2.4 4 4.8
3 2.8 9 8.4
4 3.0 16 12.0
5 3.2 25 16.0
6 3.6 36 21.6
7 3.8 49 26.6
8 4.0 64 32.0
36 24.8 204 123.4

 Y X
a bi

n
i
a = 1.836
n
n X Y  (  X ) (  Y )
b = 0.281
i i i i
b
n X i  X i
2  2

Y9 = a + bX = 1.836 + 0.281 * 9 = 4.365 = 4.4 95


VENTAS DE PERIÓDICOS PROYECTADAS PARA EL AÑO 9
i (Años) Yi (Demanda) Xi (Población) XiYi Xi2 Y i2
1 3.0 2.0 6.0 4.0 9.0
2 3.5 2.4 8.4 5.8 12.3
3 4.1 2.8 11.5 7.8 16.8
4 4.4 3.0 13.2 9.0 19.4
5 5.0 3.2 16.0 10.2 25.0
6 5.7 3.6 20.5 13.0 32.5
7 6.4 3.8 24.3 14.4 41.0
8 7.0 4.0 28.0 16.0 49.0
Sumatorias 39.1 24.8 127.9 80.2 205.0

 Y X
a b
n
i i
a = -1.34
n
n X Y  (  X ) (  Y )
b = 2.01
i i i i
b
n X i  X i
2  2

Y9 = a + bX = -1.34 + 2.01 * 4.4 = 7.50 96


Ejemplo 2
Considere los datos experimentales de la tabla adjunta, que se
obtuvo de 33 muestras de desechos tratados químicamente, en el
estudio que se realizó en el Instituto Politécnico y Universidad
Estatal de Virginia.

95
Ejemplo 2 (continuación)
Estime la recta de regresión para los datos de
contaminación de la tabla del Ejemplo 2

Por lo tanto

Así, la recta de regresión estimada está dada por

96
EJERCICIO EN CLASE 1
• Ajustar un modelo de regresión simple a los datos de la pureza de
oxigeno que se muestra en la siguiente tabla:

97
Fin presentación

100
*
101
El promedio de los índices periódicos debe
dar un total igual a 1.0
0.945  1.355  1.060  0.685 4.045
 1.01125
4 4
0.9345
1.3399
1.0482
0.6774
4.0000

*
0.9345 + 1.3399 + 1.0482 + 0.6774 4.0000
= = 1.000
4 4
102
a=
 x
2
 y   x  xy
n x  x 
2

2

*
103
b=
n  xy   x  y
n  x  x 
2 2

*
104
COEFICIENTE DE CORRELACION

r=
n  xy  x  y
n  x   xn  y   y
2 2 2 2

*
105
COEFICIENTE DE DETERMINACION

2 n  xy   x  y
2

r 
n x 2
  x  
2
n y 2
 y  2

*
106
*
107
108 *

También podría gustarte