BIOESTADÍSTICA                                                                                          SALUD
DISTRIBUCIÓN BIDIMENSIONAL
Si a cada unidad estadística se le observa simultáneamente dos variables cuantitativas entonces se
obtiene dos series de datos emparejados. En este caso con frecuencia se desea conocer si ambas variables
están relacionadas o si son independientes.
                           Unidad estadística                     𝑿                   𝒀
                                    1                             𝑥1                  𝑦1
                                    2                             𝑥2                  𝑦2
                                    3                             𝑥3                  𝑦3
                                         n                       𝑥𝑛                   𝑦𝑛
Es decir, se tiene n observaciones bidimensionales:
                       (𝑿𝒊 , 𝒀𝒊 ): (𝑿𝟏 , 𝒀𝟏 ); (𝑿𝟐 , 𝒀𝟐 ); (𝑿𝟑 , 𝒀𝟑 ); … ; (𝑿𝒊 , 𝒀𝒊 ); … ; (𝑿𝒏 , 𝒀𝒏 )
DIAGRAMA DE DISPERSIÓN (esparcimiento): Cada par de datos bidimensionales representa un
punto en el sistema cartesiano.
                                                             1
BIOESTADÍSTICA                                                                             SALUD
Este conjunto de puntos (𝑿𝒊 , 𝒀𝒊 ) se llama “diagrama de esparcimiento”, “diagrama de dispersión”,
“dispersigrama” o ”nube de puntos”. El diagrama de dispersión puede tomar diferentes formas:
Entonces, según la forma del diagrama de dispersión; podemos pensar en un modelo matemático que
mejor describa la relación existente entre X e Y.
Ejemplos:
                                                    2
BIOESTADÍSTICA                                                                     SALUD
ANÁLISIS DE CORRELACIÓN: Es el método empleado para determinar el grado de relación entre
las variables que se estudian para así determinar en qué medida una relación funcional describe o
explica de una forma adecuada la relación entre estas variables.
FUERZA DE LA CORRELACIÓN: Es la cercanía en los cambios de ambas variables. A mayor
correlación, más tienden a formar una línea recta en el diagrama de dispersión.
COEFICIENTE DE CORRELACIÓN LINEAL SIMPLE 𝒓: (Coeficiente de Pearson): Indica si hay
relación lineal entre dos variables y el grado de esta relación (alta, baja o nula). Permite contestar
¿qué tan estrecha es la relación entre X e Y?
                         𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 )                     ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
                                                                                               ̅)(𝒚𝒊 − 𝒚
                                                                                                       ̅)
          𝑟=                                                               =
               √𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐       √∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
                                                                                           ̅)𝟐 √∑𝒏𝒊=𝟏(𝒚𝒊 − 𝒚
                                                                                                           ̅)𝟐
                                                    𝑛                      𝑛
                                                1                     1
                                            𝑥̅ = ∑ 𝑥𝑖         ;   𝑦̅ = ∑ 𝑦𝑖
                                                𝑛                     𝑛
                                                   𝑖=1                 𝑖=1
El signo de 𝒓 tiene que ver sólo con la dirección de la relación entre dos variables, ya sea directa o
inversa y la magnitud del coeficiente tiene que ver con la intensidad o estrechez de la relación. El valor
de 𝒓 puede ser positivo, negativo o cero.
    0 < 𝑟 < 1: la correlación entre las dos variables es positiva, cuanto más cerca esté el valor de 𝒓
       a +1 más fuerte es la relación entre las variables. En este caso, una variable tiende a incrementar
       su valor cuando la otra también aumenta.
                                                             3
BIOESTADÍSTICA                                                                                  SALUD
    𝑟 = +1: las dos variables tienen una correlación perfecta positiva, es decir, tienen una relación
       lineal positiva.
INTERPRETACIÓN
       Valor                  Significado
       -1                     Correlación negativa perfecta
       -0.70 a -0.99          Correlación negativa alta
       -0.50 a -0.69          Correlación negativa moderada
       -0,20 a -0.49          Correlación negativa baja
       -0.01 a -0.19          Correlación negativa muy baja
                                                                     No    es    recomendable
            0                 Correlación nula                       aplicar regresión lineal
       +0.01 a +0.19          Correlación positiva muy baja
       +0,20 a +0.49          Correlación positiva baja
       +0.50 a +0.69          Correlación positiva moderada
       +0.70 a +0.99          Correlación positiva alta
       +1                     Correlación positiva perfecta
Ejercicio 1: Una encuesta realizada entre vendedores de autos usados para determinar la relación
entre la cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados del
número de avisos clasificados y el número de automóviles usados vendidos para cada uno de los negocios
que no utilizaron ningún otro medio publicitario.
                          n     Nº Anuncios clasificados:     Nº Autos vendidos:
                          1               74                         139
                          2               45                         110
                          3               50                          95
                          4               38                          78
                          5               29                          60
                          6               17                          54
                                                      4
BIOESTADÍSTICA                                                                                                      SALUD
Calcular e interpretar el coeficiente de correlación.
Sea Y: Nº Autos vendidos y X: Nº Anuncios clasificados
Solución
                                          160
                                          140
                   N° de autos vendidos
                                          120
                                          100
                                          80
                                          60
                                          40
                                          20
                                           0
                                                0   10   20      30      40         50      60     70      80
                                                              N° de anuncios clasificados
Existe una correlación positiva.
  n           N° de anuncios clasificados X                     N° de autos vendidos Y             XY      𝒙𝒊 𝟐     𝒚𝒊 𝟐
  1                        74                                            139                     10286    5476    19321
  2                        45                                            110                     4950     2025    12100
  3                        50                                             95                      4750    2500     9025
  4                        38                                             78                     2964     1444     6084
  5                        29                                             60                      1740    841      3600
  6                        17                                             54                       918    289      2916
Sumas                     253                                            536                     25608   12575    53046
                 𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − ∑𝒏𝒊=𝟏 𝒙𝒊 ∑𝒏𝒊=𝟏 𝒚𝒊                                 𝟔(𝟐𝟓𝟔𝟎𝟖) − (𝟐𝟓𝟑)(𝟓𝟑𝟔)
𝒓=                                                                    =
     √𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐            √𝟔(𝟏𝟐𝟓𝟕𝟓) − (𝟐𝟓𝟑)𝟐 ∗ √𝟔(𝟓𝟑𝟎𝟒𝟔) − (𝟓𝟑𝟔)𝟐
𝒓 = 𝟎. 𝟗𝟓𝟖𝟐
 En Excel se usa la función
 =COEF.DE.CORREL(Matriz 1, Matriz 2)
Interpretación: Como 𝒓 = 𝟎. 𝟗𝟓𝟖𝟐 > 𝟎 existe una correlación positiva alta entre el número de anuncios
clasificados y el número de autos vendidos.
Aplicación
                                                                      5
BIOESTADÍSTICA                                                                            SALUD
Ejercicio 2: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50
preguntas. Calcule el coeficiente de correlación.
                               n    N° de intentos       N° de errores
                               1           1                  15
                               2           2                  12
                               3           3                  10
                               4           4                   8
                               5           5                   7
                               6           6                   5
                               7           7                   5
                               8           8                   3
                               9           9                   1
                              10          10                   1
Diagrama de dispersión
Existe una correlación negativa alta.
                  n   N° de intentos     N° de errores      XY           XX    YY
                  1          1                 15           15            1    225
                  2          2                 12           24            4    144
                  3          3                 10           30            9    100
                  4          4                 8            32           16    64
                  5          5                 7            35           25    49
                  6          6                 5            30           36    25
                  7          7                 5            35           49    25
                  8          8                 3            24           64     9
                  9          9                 1            9            81     1
                 10         10                 1            10           100    1
             Sumas          55                 67          244           385   643
                                                     6
BIOESTADÍSTICA                                                                                         SALUD
              𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 )                      𝟏𝟎(𝟐𝟒𝟒) − (𝟓𝟓)(𝟔𝟕)
𝒓=                                                             =
                               𝟐                           𝟐
     √𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 ) √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )       √𝟏𝟎(𝟑𝟖𝟓) − (𝟓𝟓)𝟐 √𝟏𝟎(𝟔𝟒𝟑) − (𝟔𝟕)𝟐
𝒓 = −𝟎. 𝟗𝟖𝟑𝟖
Interpretación: Como 𝒓 = −𝟎. 𝟗𝟖𝟑𝟖 < 𝟎 existe una correlación negativa alta entre el número de
intentos y el número de errores.
Ejercicio 3: El propietario de Volvo desea estudiar la relación entre la antigüedad de un automóvil y
su precio de venta. La siguiente lista es una muestra aleatoria de 12 automóviles usados que vendió el
concesionario durante el año anterior.
                         Antigüedad (años) Precio de venta (miles de dólares)
                                     10                                   7.5
                                     8                                    8.5
                                     15                                    2
                                     14                                    4
                                     8                                    8.2
                                     9                                     8
                                     8                                    9.8
                                     11                                    6
                                     12                                   6.5
                                     13                                    5
                                     7                                    10
                                     6                                    12
        Construya el diagrama de dispersión y calcule el coeficiente de correlación.
                                                               7
BIOESTADÍSTICA                                                                                                                     SALUD
                                                   14
                    Precio de venta (miles de $)
                                                   12
                                                   10
                                                    8
                                                    6
                                                    4
                                                    2
                                                    0
                                                         0   2     4          6       8      10          12    14      16
                                                                              Antiguedad (años)
                                                     n        X          Y             XY          XX            YY
                                                       1     10        7.5             75         100          56.25
                                                       2      8        8.5             68          64          72.25
                                                       3     15         2              30         225            4
                                                       4     14         4              56         196           16
                                                       5      8        8.2            65.6         64          67.24
                                                       6      9         8              72          81           64
                                                       7      8        9.8            78.4         64          96.04
                                                       8     11         6              66         121           36
                                                       9     12        6.5             78         144          42.25
                                                      10     13         5              65         169           25
                                                      11      7         10             70          49           100
                                                      12      6         12             72          36           144
                                                   Suma      121       87.5           796         1313        723.03
               𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 − (∑𝒏𝒊=𝟏 𝒙𝒊 )(∑𝒏𝒊=𝟏 𝒚𝒊 )                                          𝟏𝟐(𝟕𝟗𝟔) − (𝟏𝟐𝟏)(𝟖𝟕. 𝟓)
𝒓=                                                                                =
     √𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒙𝒊 )𝟐 √𝒏 ∑𝒏𝒊=𝟏 𝒚𝒊 𝟐 − (∑𝒏𝒊=𝟏 𝒚𝒊 )𝟐                        √𝟏𝟐(𝟏𝟑𝟏𝟑) − (𝟏𝟐𝟏)𝟐 √𝟏𝟐(𝟕𝟐𝟑. 𝟎𝟑) − (𝟖𝟕. 𝟓)𝟐
𝒓 = −𝟎. 𝟗𝟕𝟎𝟗𝟑𝟐
Interpretación: Como 𝒓 = −0.9709 < 𝟎 existe una correlación negativa alta entre la antigüedad del
automóvil y el precio de venta.