où est le nombre de mesures, la valeur de la ième mesure , la valeur prédite correspondante et la moyenne des mesures.
Cas de la régression linéaire univariée par la méthode des moindres carrés
Dans le cas d'une régression linéaire univariée (une seule variable prédictive) par la méthode des moindres carrés, on montre que la variance (totale) SST est la somme de la variance expliquée par la régression SSE et de la moyenne des carrés des résidus SSR, de sorte que :
c'est-à-dire que le coefficient de détermination est alors le rapport de la variance expliquée par la régression SSE sur la variance totale SST[1].
Dans le cas univarié, on montre que c'est aussi le carré du coefficient de corrélation entre les valeurs de la variable prédictive et les mesures . C'est une conséquence immédiate de la relation : démontrée ici et ici.
La propriété précédente permet de voir le coefficient de détermination comme une généralisation du coefficient de corrélation au cas d'une régression linéaire multivariée.
Notes et références
↑Université Paris Ouest Nanterre La Défense, PMP STA 21 Méthodes statistiques pour l'analyse des données en psychologie, «Chapitre 4 : Régression linéaire p. 7
Voir aussi
Bibliographie
Pierre Bailly et Christine Carrère, Statistiques descriptives : Théorie et applications, PUG, coll. « Libres cours économie », (lire en ligne), p. 165-167.