Droite de régression et Ajustement Linéaire

  • L'idée est de transformer un nuage de point en une droite. Celle-ci doit être la plus proche possible de chacun des points.

  • On cherchera donc à minimiser les écarts entre les points et la droite.

La droite la plus proche possible de chacun des points

  • Pour cela, on utilise la méthode des moindres carrées (MCO). Cette méthode vise à expliquer un nuage de points par une droite qui lie "Y" à "X", c'est à dire, Y = aX + b ;

telle que la distance entre le nuage de points et la droite soit minimale.

  • Cette distance matérialise l'erreur, c'est à dire la différence entre le point réellement observé et le point prédit par la droite.

  • Si la droite passe au milieu des points, cette erreur sera alternativement positive et négative, la somme des erreurs étant par définition nulle.

  • Ainsi, la méthode des moindres carrés (MCO) consiste à chercher la valeur des paramètres "a" et "b" qui minimise la somme des erreurs élevées au carré.

* La méthode des moindres carrées (MCO):

  • On pose:

avec "ei" est l'erreur commise sur chaque observation, c'est à dire;

  • La méthode des moindres carrées (MCO) consiste donc à minimiser la fonction U (la somme des erreurs commises). Nous avons la condition de minimisation suivante:

Syntax

  • Donc, la droite de régression est donnée par:

Method

  • Moyenne de "X":

  • Variance de "X":

  • Moyenne de "Y":

  • Variance de "Y":

  • Covariance de "X et Y":