Parfois, la régression linéaire ne suffit pas tout à fait – en particulier lorsque nous pensons que nos relations observées sont non linéaires. Pour cette raison, nous devons nous tourner vers d’autres types de régression. Cette page est une brève leçon sur la façon de calculer une régression quadratique dans Excel. Comme toujours, si vous avez des questions, envoyez-moi un courriel à [email protected]!
Le type typique de régression est la régression linéaire, qui identifie une relation linéaire entre le ou les prédicteurs et un résultat. Il arrive cependant que nos effets soient non linéaires. Dans ces cas, nous devons appliquer différents types de régression.
Une relation non linéaire courante est la relation quadratique, qui est une relation décrite par une seule courbe. Dans ces cas, la relation entre deux variables peut ressembler à un U ou à un U inversé. Souvent, nous appelons la dernière de ces relations (le U inversé) un effet de » trop de bonne chose « . En d’autres termes, lorsqu’une variable augmente, l’autre augmente également ; cependant, à partir d’un certain point, la relation diminue. Par exemple, le caractère consciencieux peut être lié à la satisfaction dans la vie. Si vous travaillez dur, vous êtes généralement plus heureux dans votre vie. Cependant, à partir d’un certain niveau de conscience, votre satisfaction dans la vie peut diminuer. Si vous êtes trop travailleur, alors vous pouvez être stressé et moins heureux dans votre vie.
On pourrait en dire plus sur la régression quadratique, mais nous allons rester simples. Pour calculer une régression quadratique, nous pouvons utiliser Excel. Si vous ne disposez pas d’un jeu de données, vous pouvez télécharger le jeu de données d’exemple ici. Dans le jeu de données, nous étudions la relation entre la conscience et la satisfaction de la vie.
Les données devraient ressembler à quelque chose comme ceci:
Si votre jeu de données a un aspect différent, vous devriez essayer de le reformater pour ressembler à l’image ci-dessus. Les instructions ci-dessous peuvent être un peu confuses si vos données ont un aspect un peu différent.
D’abord, nous pourrions créer un diagramme de dispersion de la relation entre la conscience et la satisfaction de la vie. Comme vous pouvez le voir, les données ont clairement une forme en U, ce qui indique que la régression quadratique devrait être appliquée.
Pour effectuer une régression quadratique, nous devons d’abord créer une nouvelle variable. Pour ce faire dans Excel, nous devons d’abord faire un clic droit sur notre colonne de résultats, puis cliquer sur Insérer.
Cela crée une nouvelle colonne. Dans cette nouvelle colonne, nous voulons que chaque cellule soit le carré de notre observation prédicteur respective. Pour ce faire, ajoutez d’abord une étiquette à la première cellule de la colonne, telle que ConSQ. Ensuite, tapez « =A2^2 » dans la deuxième cellule de la colonne (sans les guillemets). Cela calculera automatiquement le carré de ce qui se trouve dans la deuxième cellule de la première colonne.
Pour faire cela pour le reste des cellules, vous pouvez double-cliquer en bas à droite de la cellule contenant la formule. Si vous le faites correctement, cela devrait automatiquement copier votre formule dans chacune des cellules suivantes, et votre feuille de calcul Excel devrait ressembler à ce qui suit :
Une fois que vous avez les valeurs au carré, nous allons effectuer une régression comme d’habitude. Cliquez sur Analyse des données.
Puis Régression et OK.
Puis, cliquez sur le bouton ci-dessous pour identifier vos données de résultat (votre plage Y).
Mettez en évidence vos données de résultat, y compris l’étiquette. Puis cliquez sur le bouton indiqué ci-dessous.
Maintenant, cliquez sur le bouton ci-dessous pour identifier vos données de prédiction (votre plage X).
Maintenant, mettez en évidence à la fois votre variable de prédiction et ses valeurs au carré, y compris leurs étiquettes. Ensuite, cliquez sur le bouton montré ci-dessous.
Enfin, cliquez sur la case pour les étiquettes et appuyez sur OK.
Nous devrions obtenir des résultats ! Yay!
Si vous avez besoin d’aide pour lire ce tableau, jetez un oeil à mon guide de la régression dans Excel. Sinon, nous pouvons clairement voir que le bêta non standardisé de la conscience est de -23,864, et que le bêta non standardisé de ses valeurs au carré est de 3,106. Ces deux valeurs sont statistiquement significatives (p < .001). Cependant, lors de l’interprétation des effets quadratiques, nous n’interprétons que la signification de l’effet d’ordre supérieur – dans ce cas, le prédicteur au carré. Ainsi, nous dirions qu’un effet quadratique significatif a été observé entre la conscience et la satisfaction dans la vie, et que la relation peut être décrite par une seule courbe. Nous examinerions ensuite le nuage de points entre les deux pour identifier la forme de la courbe, qui ressemble à un U. Enfin, nous pourrions identifier que le R-carré global du modèle était de 0,78, ce qui est très élevé pour les sciences sociales !
Bien sûr, les résultats fournissent d’autres informations, qui peuvent être utiles pour vos certains objectifs, mais le guide actuel ne couvre que les bases.