Seminar 1.
Noţiuni recapitulative
În ultimul an, 10 firme din domeniul distribuţiei de electrocasnice au obţinut următorul profit
brut (Y) şi au avut următoarele cheltuieli cu publicitatea (X):
                            Firma       Profit (Y)     Ch. cu pub. (X)
                          1                17                 3
                          2                20                 3
                          3                16                2.5
                          4                 6                1.2
                          5                11                2.7
                          6                 9                2.5
                          7                25                 4
                          8                14                2.8
                          9                12                2.3
                          10                8                1.4
Analizaţi legătura dintre variabile folosind metode neparametrice şi parametrice.
Formule necesare:
                              1
Dispersia (varianţa): 𝜎𝑋2 =       ∑𝑁        ̅ 2
                                   𝑖=1(𝑥𝑖 − 𝑋 )
                              𝑁
Abaterea medie pătratică: σX
      Proprietăţile mediei (M)                        Proprietăţile dispersiei (D)
            𝑀(𝐶) = 𝐶                                       𝐷(𝐶) = 0
       𝑀(𝐶 ∙ 𝑋) = 𝐶 ∙ 𝑀(𝑋)                             𝐷(𝐶 ∙ 𝑋) = 𝐶 2 𝐷(𝑋)
     𝑀(𝑋 + 𝑌) = 𝑀(𝑋) + 𝑀(𝑌)                        𝐷(𝑋 + 𝑌) = 𝐷(𝑋) + 𝐷(𝑌)
                                                    dacă X,Y sunt independente liniar
      𝑀(𝑋𝑌) = 𝑀(𝑋) ∙ 𝑀(𝑌),                   𝐷(𝑋 + 𝑌) = 𝐷(𝑋) + 𝐷(𝑌) + 2𝑐𝑜𝑣(𝑋, 𝑌)
  dacă X,Y sunt independente liniar          𝐷(𝑋 − 𝑌) = 𝐷(𝑋) + 𝐷(𝑌) − 2𝑐𝑜𝑣(𝑋, 𝑌)
                                        𝐷(𝑋 + 𝑌 + 𝑍) = 𝐷(𝑋) + 𝐷(𝑌) + 𝐷(𝑍) + 2𝑐𝑜𝑣(𝑋, 𝑌)
                                                     + 2𝑐𝑜𝑣(𝑋, 𝑍) + 2𝑐𝑜𝑣(𝑌, 𝑍)
                                                     𝐷(𝑋) = 𝑀(𝑋 2 ) − [𝑀(𝑋)]2
Metode neparametrice: covarianţa şi coeficientul de corelaţie liniară.
Covarianţa – măsoară legătura dintre două variabile.
Notaţie: 𝑐𝑜𝑣(𝑋, 𝑌) 𝑠𝑎𝑢 𝜎𝑋𝑌
                     1
Formulă: 𝑐𝑜𝑣(𝑋, 𝑌) = 𝑁 ∑𝑁        ̅        ̅
                        𝑖=1(𝑥𝑖 − 𝑋 )(𝑦𝑖 − 𝑌) 𝑠𝑎𝑢         𝑐𝑜𝑣(𝑋, 𝑌) = 𝑀(𝑋𝑌) − 𝑀(𝑋) ∙ 𝑀(𝑌)
Interpretare:   𝑐𝑜𝑣(𝑋, 𝑌) = 0 − nu există legătură liniară între 𝑋 şi 𝑌
                𝑐𝑜𝑣(𝑋, 𝑌) > 0 − există legătură directă între 𝑋 şi 𝑌
                 𝑐𝑜𝑣(𝑋, 𝑌) < 0 − există legătură inversă între 𝑋 şi 𝑌
Coeficientul de corelaţie liniară – măsoară intensitatea legăturii dintre două variabile.
Notaţie: 𝜌(𝑋, 𝑌) 𝑠𝑎𝑢        𝜌𝑋𝑌
                       𝑐𝑜𝑣(𝑋,𝑌)
Formulă: 𝜌(𝑋, 𝑌) =                𝜖[−1; 1]
                        𝜎𝑋 ∙𝜎𝑌
Interpretare: |𝜌𝑋𝑌 |𝜖(0; 0.3) − legătură de intensitate mică
              |𝜌𝑋𝑌 |𝜖(0.3; 0.7) − legătură de intensitate medie
 Metode parametrice:     regresia liniară simplă
              |𝜌𝑋𝑌 |𝜖(0.7; 1) − legătură de intensitate mare
Metoda parametrică: regresia liniară simplă
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
X, Y – variabilele modelului
𝛽1 , 𝛽2 – parametri modelului care trebuie estimaţi (prin metoda celor mai mici pătrate)
      𝑐𝑜𝑣(𝑋, 𝑌)
𝛽̂2 =
          𝜎𝑋2
𝛽̂1 = 𝑌̅ − 𝛽̂2 𝑋̅
      𝛽̂22 ∙ 𝜎𝑋2
𝑅2 =
          𝜎𝑌2
Doar în cazul regresiei liniare simple: 𝜌2 = 𝑅 2