[go: up one dir, main page]

0% encontró este documento útil (0 votos)
17 vistas4 páginas

Análisis de Regresión Lineal Simple

Este documento presenta 7 ejemplos de regresión lineal simple utilizando diferentes conjuntos de datos. Se analizan los parámetros de las rectas de regresión, la significancia de las mismas, y la bondad del ajuste lineal para cada caso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
17 vistas4 páginas

Análisis de Regresión Lineal Simple

Este documento presenta 7 ejemplos de regresión lineal simple utilizando diferentes conjuntos de datos. Se analizan los parámetros de las rectas de regresión, la significancia de las mismas, y la bondad del ajuste lineal para cada caso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 4

Modelos Estadísticos para las ciencias de la computación

Práctico 8. Regresión Lineal Simple

1. A partir de datos de Precipitación anual (mm) y de la Altura sobre el nivel del mar (m) registrados en 22 estaciones
se obtuvieron: Sxy = 6320.89, S2y = 4839.49,
S x =10373.5, y  657.5909 y x  209.0909
2 800

a) Mirando el diagrama de dispersión, ¿cree que el ajuste es 750


razonable?

Precipitac. Anual (mm)


b) Hallar la recta de regresión. 700
c) Completar:
i) Si se aumenta la altura en un metro sobre el nivel del mar, la 650
precipitación anual……….………………. en …………..mm.
ii) Las unidades de la ordenada al origen son……… y las de la 600
pendiente ………..
550
d) ¿Qué valor de precipitación promedio anual predice la recta de
ajuste para una altura de 500m sobre el nivel del mar?
500
e) Si el coeficiente de determinación en este caso, es del 79,5%, ¿qué
0 50 100 150 200 250 300 350
significa este porcentaje? Altura s.n.m. (m)

2. Se desea estudiar el efecto de la calidad del aire en un lago. Un experimentador tomó observaciones
aleatoriamente del pH del agua y de la calidad del aire, midiendo esta última a través de un índice de calidad de aire.
Dicho índice posee una escala que oscila entre 0 y 100, donde los números crecientes indican una contaminación
cada vez mayor. Los datos obtenidos fueron los siguientes:

X pH 4.5 4.1 4.8 4.0 5.0 6.0 3.5 4.9 3.2 6.1
Y Calidad de aire 40 50 30 60 20 10 70 30 85 15

a) Mediante el software infostat representar gráficamente los datos.


b) Calcular la recta de regresión usada para estimar  Y / X la calidad promedio del aire, medido en un valor de pH x.
c) Estimar la calidad promedio de aire en una zona del lago cuyo pH es de 3.8.
d) Hallar el coeficiente de determinación como medida de la bondad de ajuste de la recta de regresión.
e) Suponiendo que se verifican los supuestos:
i) Estimar el valor de  y el error estándar de la pendiente.
ii) Probar la significación de la regresión lineal con un  = 0.05. ¿Qué conclusión se obtuvo?
iii) Estimar mediante un intervalo de confianza del 95% el valor real de la pendiente. Interpretar el resultado en el
contexto de los datos.

3. Se desea investigar si existe una relación lineal entre las alturas de los padres y la de sus respectivos hijos. La
siguiente tabla muestra las alturas (en pulgadas) de 12 padres seleccionados al azar y las de sus hijos primogénitos:

X Altura de padres 65 63 67 64 68 62 70 66 68 67 69 71
Y Altura de hijos 68 66 68 65 69 66 68 65 71 67 68 70

a) Mediante el software Infostat representar gráficamente los datos.


b) Calcular la recta de regresión usada para estimar  Y / X, la altura promedio del primogénito, cuando la altura de su
padre es x.
c) Estimar, si es posible, la altura promedio del primogénito cuyo padre mide 65 pulgadas.
d) Suponiendo que se verifican los supuestos:
i) Probar la significación de la regresión lineal con un  = 0.05. ¿Qué conclusión se obtuvo?
ii) Estimar mediante un intervalo de confianza del 95% el valor real de la pendiente. Interpretar el resultado en el
contexto del problema.

1
4. La relación entre X: pulsaciones por minuto en reposo e Y : tiempo en correr 1 milla (en seg.) se muestra en el
siguiente diagrama de dispersión:
Los datos corresponden a 20 empleados del club de salud de una
600
empresa.
tiempo en correr una milla

n = 20 x  64,45 y  389 S2x = 79,84 S2y = 5767,58 Sxy = 278,05


50 0

400

300
a) Hallar la recta de regresión usada para estimar  Y / X, el tiempo
200
promedio en correr una milla, medido en un empleado cuyas
10 0
pulsaciones por minuto en reposo son de x.
0 b) Probar la significación de la regresión con un  = 0.05. ¿Qué
45 55 65 75 85

pulsaciones por m inuto en reposo


conclusión se obtuvo?
c) Podría usarse la recta de regresión estimada para predecir
satisfactoriamente el tiempo promedio de un empleado cuyas
pulsaciones por minuto son de:
i) 30. ii) 96. Justificar la respuesta.
d) Determinar el coeficiente de determinación. ¿Qué se puede concluir al respecto?
e) ¿Qué unidades tiene cada uno de los parámetros del Modelo Lineal?

5. El tiempo que tarda un sistema informático en red en ejecutar una instrucción depende del número de usuarios
conectados a él. Si no hay usuarios el tiempo es 0. Tenemos los siguientes datos:

X = N° de usuarios 10 15 20 20 25 30

Y= Tiempo de ejecución (seg.) 1 1.2 2 2.1 2.2 2

A partir del diagrama de dispersión y de la salida del software Infostat, responder:


a) ¿Cuál es la recta de mínimos cuadrados que relaciona la cantidad de usuarios con el tiempo medio de ejecución
de una instrucción?
b) Podría usarse la recta de regresión estimada para predecir satisfactoriamente el tiempo promedio de ejecución de
una instrucción si están conectados:
i) 45 usuarios. ii) 24 usuarios. Justificar la respuesta.
c) ¿Qué porcentaje de variación del tiempo de ejecución es explicada linealmente por el número de usuarios
conectados?
d) Suponiendo el cumplimiento de los supuestos:
i) Estimar el valor de  y el error estándar de la pendiente.
ii) ¿cuál es el intervalo de confianza de 95%para estimar la pendiente de la recta?
iii)¿Qué concluye acerca de la significación de la regresión según el valor P?

6. Una compañía de seguros desea explicar linealmente el monto del seguro de vida del jefe de familia, mediante el
ingreso familiar, X. Con base en una muestra aleatoria de 18 familias, se obtuvo la siguiente información (en miles de
dólares).

2
A partir del diagrama de dispersión y de la salida del software Infostat, responder:
a) ¿Cuál es la recta de mínimos cuadrados que relaciona el monto promedio de seguro de vida del jefe de familia con
el ingreso familiar?
b) Interpretar, en términos del problema, la pendiente de la recta de ajuste.
c) ¿Cuál sería el monto promedio de seguro de vida de un jefe de familia cuyo ingreso familiar es de 27 miles de
dólares?
d) ¿Qué porcentaje de variación del monto de seguro de vida de un jefe de familia es explicada por el modelo?
e) ¿Qué puede concluir respecto de los supuestos para hacer inferencia en la Regresión lineal simple?
f) ¿Se puede chequear la significación de la regresión? Justificar la respuesta.

7. Mediante una muestra de 30 mujeres en edad fértil (entre 9 y 50 años), se intentó determinar la relación existente
entre la presión sanguínea Y (en mm de Hg) y la edad X en años, con el fin de estimar la primera en función de la
última. La recta de regresión hallada por el método de mínimos cuadrados es: Y = 81.54 + 1.22 X. El intervalo de
confianza del 99% para estimar el valor de la pendiente dio: (0.20, 2.24).
Indicar si las siguientes afirmaciones son V o F:
a) Hay una regresión significativa.
……
b) La pendiente no tiene unidades.
……
c) La ordenada al origen puede interpretarse en este caso porque el cero pertenece al rango de valores de X donde
fue estimada la recta. ……

d) Una mujer de 60 años se espera que tenga una presión sanguínea promedio de aproximadamente 155 mmm de ……
Hg.

e) De acuerdo a los resultados, la presión sanguínea promedio aumenta con la edad.


……

8. Se desea estudiar la relación existente entre la dosis (en gr.) de alcohol etílico ingerida y el tiempo de reacción (en
seg.) a un estímulo auditivo, con el fin de predecir el comportamiento de la segunda en función de la primera. Para
ello se seleccionaron 15 personas al azar y se les midió estas variables. Los datos obtenidos fueron los siguientes:

3
Dosis (gr.) 0 0 250 280 300 320 340 355 460 482 500 510 530 650 675
Tiempo (seg.) 2 1 4 5 6 7 8 7 8 9 10 14 12 18 22

A partir de la salida del software Infostat, responder:

a. Determinar la recta de regresión.


b. Si la dosis de alcohol etílico se incrementa en un gr. ¿cuánto aumenta el tiempo de reacción a un estímulo
auditivo?
c. Si una persona ingiere 1000 gr. de alcohol etílico, ¿cuánto tarda, en promedio, en reaccionar a un estímulo
auditivo? ¿y si ingiere 512 gr?
e. Calcular el R2. Interpretar su valor en términos del problema.

g. Verificación de los supuestos:


g1. ¿Se cumple la linealidad?

g.2 ¿Existe homocedasticidad?

g3. ¿el supuesto de distribución normal se verifica?

h. ¿Tienen sentido las salidas de inferencia de la regresión lineal simple anteriores?

9. Para analizar la degradación de la señal emitida por una antena, se tomaron los datos que se muestran en la base
“Frecuencias” disponible en el Moodle. Se desea predecir linealmente la frecuencia de la señal al ser recibida (Y),
mediante la frecuencia de la señal en el momento de ser emitida (X). Los resultados están medidos en Megahercios.
Realizar un análisis de regresión lineal simple completo a través del software Infostat. Verificar los supuestos antes
de realizar el estudio inferencial.

También podría gustarte