[go: up one dir, main page]

0% encontró este documento útil (0 votos)
25 vistas8 páginas

2 Análisis de Correlación

El documento aborda la distribución bidimensional de datos en bioestadística, enfocándose en la relación entre dos variables cuantitativas mediante el análisis de correlación. Se explica el uso del diagrama de dispersión para visualizar la relación y se introduce el coeficiente de correlación lineal simple (r) para medir la fuerza y dirección de dicha relación. Se presentan ejemplos prácticos para ilustrar el cálculo e interpretación del coeficiente de correlación en diferentes contextos.

Cargado por

dsgustavo.2318
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
25 vistas8 páginas

2 Análisis de Correlación

El documento aborda la distribución bidimensional de datos en bioestadística, enfocándose en la relación entre dos variables cuantitativas mediante el análisis de correlación. Se explica el uso del diagrama de dispersión para visualizar la relación y se introduce el coeficiente de correlación lineal simple (r) para medir la fuerza y dirección de dicha relación. Se presentan ejemplos prácticos para ilustrar el cálculo e interpretación del coeficiente de correlación en diferentes contextos.

Cargado por

dsgustavo.2318
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 8

BIOESTADÍSTICA SALUD

DISTRIBUCIÓN BIDIMENSIONAL
Si a cada unidad estadística se le observa simultáneamente dos variables cuantitativas entonces se
obtiene dos series de datos emparejados. En este caso con frecuencia se desea conocer si ambas variables
están relacionadas o si son independientes.
Unidad estadística 𝑿 𝒀
1 𝑥1 𝑦1
2 𝑥2 𝑦2
3 𝑥3 𝑦3

n 𝑥𝑛 𝑦𝑛

Es decir, se tiene n observaciones bidimensionales:


(𝑿𝒊 , 𝒀𝒊 ): (𝑿𝟏 , 𝒀𝟏 ); (𝑿𝟐 , 𝒀𝟐 ); (𝑿𝟑 , 𝒀𝟑 ); … ; (𝑿𝒊 , 𝒀𝒊 ); … ; (𝑿𝒏 , 𝒀𝒏 )
DIAGRAMA DE DISPERSIÓN (esparcimiento): Cada par de datos bidimensionales representa un
punto en el sistema cartesiano.

1
BIOESTADÍSTICA SALUD
Este conjunto de puntos (𝑿𝒊 , 𝒀𝒊 ) se llama “diagrama de esparcimiento”, “diagrama de dispersión”,
“dispersigrama” o ”nube de puntos”. El diagrama de dispersión puede tomar diferentes formas:

Entonces, según la forma del diagrama de dispersión; podemos pensar en un modelo matemático que
mejor describa la relación existente entre X e Y.
Ejemplos:

2
BIOESTADÍSTICA SALUD
ANÁLISIS DE CORRELACIÓN: Es el método empleado para determinar el grado de relación entre
las variables que se estudian para así determinar en qué medida una relación funcional describe o
explica de una forma adecuada la relación entre estas variables.

FUERZA DE LA CORRELACIÓN: Es la cercanía en los cambios de ambas variables. A mayor


correlación, más tienden a formar una línea recta en el diagrama de dispersión.

COEFICIENTE DE CORRELACIÓN LINEAL SIMPLE 𝒓: (Coeficiente de Pearson): Indica si hay


relación lineal entre dos variables y el grado de esta relación (alta, baja o nula). Permite contestar
¿qué tan estrecha es la relación entre X e Y?
𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 ) ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)(𝒚𝒊 − 𝒚
̅)
𝑟= =
√𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐 √∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐 √∑𝒏𝒊=𝟏(𝒚𝒊 − 𝒚
̅)𝟐

𝑛 𝑛
1 1
𝑥̅ = ∑ 𝑥𝑖 ; 𝑦̅ = ∑ 𝑦𝑖
𝑛 𝑛
𝑖=1 𝑖=1

El signo de 𝒓 tiene que ver sólo con la dirección de la relación entre dos variables, ya sea directa o
inversa y la magnitud del coeficiente tiene que ver con la intensidad o estrechez de la relación. El valor
de 𝒓 puede ser positivo, negativo o cero.
 0 < 𝑟 < 1: la correlación entre las dos variables es positiva, cuanto más cerca esté el valor de 𝒓
a +1 más fuerte es la relación entre las variables. En este caso, una variable tiende a incrementar
su valor cuando la otra también aumenta.

3
BIOESTADÍSTICA SALUD
 𝑟 = +1: las dos variables tienen una correlación perfecta positiva, es decir, tienen una relación
lineal positiva.

INTERPRETACIÓN
Valor Significado
-1 Correlación negativa perfecta
-0.70 a -0.99 Correlación negativa alta
-0.50 a -0.69 Correlación negativa moderada
-0,20 a -0.49 Correlación negativa baja
-0.01 a -0.19 Correlación negativa muy baja
No es recomendable
0 Correlación nula aplicar regresión lineal
+0.01 a +0.19 Correlación positiva muy baja
+0,20 a +0.49 Correlación positiva baja
+0.50 a +0.69 Correlación positiva moderada
+0.70 a +0.99 Correlación positiva alta
+1 Correlación positiva perfecta

Ejercicio 1: Una encuesta realizada entre vendedores de autos usados para determinar la relación
entre la cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados del
número de avisos clasificados y el número de automóviles usados vendidos para cada uno de los negocios
que no utilizaron ningún otro medio publicitario.
n Nº Anuncios clasificados: Nº Autos vendidos:
1 74 139
2 45 110
3 50 95
4 38 78
5 29 60
6 17 54

4
BIOESTADÍSTICA SALUD
Calcular e interpretar el coeficiente de correlación.
Sea Y: Nº Autos vendidos y X: Nº Anuncios clasificados
Solución

160
140
N° de autos vendidos

120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80
N° de anuncios clasificados

Existe una correlación positiva.


n N° de anuncios clasificados X N° de autos vendidos Y XY 𝒙𝒊 𝟐 𝒚𝒊 𝟐
1 74 139 10286 5476 19321
2 45 110 4950 2025 12100
3 50 95 4750 2500 9025
4 38 78 2964 1444 6084
5 29 60 1740 841 3600
6 17 54 918 289 2916
Sumas 253 536 25608 12575 53046

𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − ∑𝒏𝒊=𝟏 𝒙𝒊 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟔(𝟐𝟓𝟔𝟎𝟖) − (𝟐𝟓𝟑)(𝟓𝟑𝟔)


𝒓= =
√𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐 √𝟔(𝟏𝟐𝟓𝟕𝟓) − (𝟐𝟓𝟑)𝟐 ∗ √𝟔(𝟓𝟑𝟎𝟒𝟔) − (𝟓𝟑𝟔)𝟐

𝒓 = 𝟎. 𝟗𝟓𝟖𝟐
En Excel se usa la función
=COEF.DE.CORREL(Matriz 1, Matriz 2)

Interpretación: Como 𝒓 = 𝟎. 𝟗𝟓𝟖𝟐 > 𝟎 existe una correlación positiva alta entre el número de anuncios
clasificados y el número de autos vendidos.
Aplicación

5
BIOESTADÍSTICA SALUD
Ejercicio 2: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50
preguntas. Calcule el coeficiente de correlación.
n N° de intentos N° de errores
1 1 15
2 2 12
3 3 10
4 4 8
5 5 7
6 6 5
7 7 5
8 8 3
9 9 1
10 10 1
Diagrama de dispersión

Existe una correlación negativa alta.

n N° de intentos N° de errores XY XX YY
1 1 15 15 1 225
2 2 12 24 4 144
3 3 10 30 9 100
4 4 8 32 16 64
5 5 7 35 25 49
6 6 5 30 36 25
7 7 5 35 49 25
8 8 3 24 64 9
9 9 1 9 81 1
10 10 1 10 100 1
Sumas 55 67 244 385 643

6
BIOESTADÍSTICA SALUD

𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 ) 𝟏𝟎(𝟐𝟒𝟒) − (𝟓𝟓)(𝟔𝟕)


𝒓= =
𝟐 𝟐
√𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 ) √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 ) √𝟏𝟎(𝟑𝟖𝟓) − (𝟓𝟓)𝟐 √𝟏𝟎(𝟔𝟒𝟑) − (𝟔𝟕)𝟐

𝒓 = −𝟎. 𝟗𝟖𝟑𝟖
Interpretación: Como 𝒓 = −𝟎. 𝟗𝟖𝟑𝟖 < 𝟎 existe una correlación negativa alta entre el número de
intentos y el número de errores.

Ejercicio 3: El propietario de Volvo desea estudiar la relación entre la antigüedad de un automóvil y


su precio de venta. La siguiente lista es una muestra aleatoria de 12 automóviles usados que vendió el
concesionario durante el año anterior.

Antigüedad (años) Precio de venta (miles de dólares)


10 7.5
8 8.5
15 2
14 4
8 8.2
9 8
8 9.8
11 6
12 6.5
13 5
7 10
6 12

Construya el diagrama de dispersión y calcule el coeficiente de correlación.

7
BIOESTADÍSTICA SALUD
14

Precio de venta (miles de $)


12
10
8
6
4
2
0
0 2 4 6 8 10 12 14 16
Antiguedad (años)

n X Y XY XX YY
1 10 7.5 75 100 56.25
2 8 8.5 68 64 72.25
3 15 2 30 225 4
4 14 4 56 196 16
5 8 8.2 65.6 64 67.24
6 9 8 72 81 64
7 8 9.8 78.4 64 96.04
8 11 6 66 121 36
9 12 6.5 78 144 42.25
10 13 5 65 169 25
11 7 10 70 49 100
12 6 12 72 36 144
Suma 121 87.5 796 1313 723.03

𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 ) 𝟏𝟐(𝟕𝟗𝟔) − (𝟏𝟐𝟏)(𝟖𝟕. 𝟓)


𝒓= =
√𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐 √𝟏𝟐(𝟏𝟑𝟏𝟑) − (𝟏𝟐𝟏)𝟐 √𝟏𝟐(𝟕𝟐𝟑. 𝟎𝟑) − (𝟖𝟕. 𝟓)𝟐

𝒓 = −𝟎. 𝟗𝟕𝟎𝟗𝟑𝟐

Interpretación: Como 𝒓 = −0.9709 < 𝟎 existe una correlación negativa alta entre la antigüedad del
automóvil y el precio de venta.

También podría gustarte