Soms is lineaire regressie niet voldoende – vooral wanneer we denken dat onze waargenomen relaties niet-lineair zijn. Daarom moeten we ons wenden tot andere soorten regressie. Deze pagina is een korte les over het berekenen van een kwadratische regressie in Excel. Zoals altijd kunt u mij een e-mail sturen op [email protected]!
Het typische type regressie is een lineaire regressie, die een lineair verband vaststelt tussen voorspeller(s) en een uitkomst. Soms zijn onze effecten echter niet-lineair. In deze gevallen moeten we verschillende soorten regressie toepassen.
Een veel voorkomende niet-lineaire relatie is de kwadratische relatie, dat is een relatie die wordt beschreven door een enkele curve. In deze gevallen kan de relatie tussen twee variabelen eruit zien als een U of een omgekeerde U. Vaak noemen we de laatste van deze relaties (de omgekeerde U) een “te veel van het goede”-effect. Dat wil zeggen, als de ene variabele stijgt, stijgt de andere ook; maar zodra je een bepaald punt bereikt, daalt de relatie weer. Gewetensvolheid kan bijvoorbeeld verband houden met levenstevredenheid. Als je hard werkt, ben je over het algemeen gelukkiger met je leven. Maar zodra je een bepaald niveau van consciëntieusheid bereikt, kan je levenstevredenheid weer afnemen. Als je te hard werkt, kun je gestrest zijn en minder gelukkig met je leven.
Er is meer te zeggen over kwadratische regressie, maar we houden het eenvoudig. Om een kwadratische regressie te berekenen, kunnen we Excel gebruiken. Als je geen dataset hebt, kun je de voorbeeld-dataset hier downloaden. In de dataset onderzoeken we de relatie tussen consciëntieusheid en levenstevredenheid.
De gegevens zouden er ongeveer zo uit moeten zien:
Als je dataset er anders uitziet, moet je proberen hem opnieuw te formatteren zodat hij op de bovenstaande afbeelding lijkt. De onderstaande instructies kunnen een beetje verwarrend zijn als uw gegevens er anders uitzien.
Op de eerste plaats kunnen we een scatter plot maken van de relatie tussen consciëntieusheid en levenstevredenheid. Zoals u kunt zien, is er een duidelijke U-vorm in de gegevens, wat aangeeft dat kwadratische regressie moet worden toegepast.
Om een kwadratische regressie uit te voeren, moeten we eerst een nieuwe variabele maken. Om dit in Excel te doen, moeten we eerst met de rechtermuisknop op onze uitkomstkolom klikken en vervolgens op Insert klikken.
Daarmee maken we een nieuwe kolom. In deze nieuwe kolom willen we dat elke cel het kwadraat is van onze respectieve voorspellende waarneming. Om dit te doen, voegen we eerst een label toe aan de eerste cel in de kolom, bijvoorbeeld ConSQ. Typ vervolgens “=A2^2” in de tweede cel van de kolom (zonder aanhalingstekens). Hierdoor wordt automatisch het kwadraat berekend van wat er in de tweede cel van de eerste kolom staat.
Om dit voor de rest van de cellen te doen, kunt u dubbelklikken rechtsonder in de cel waar de formule in staat. Als u dit correct doet, wordt uw formule automatisch gekopieerd naar elk van de volgende cellen en ziet uw Excel-spreadsheet er als volgt uit:
Nadat u de gekwadrateerde waarden hebt, gaan we zoals gewoonlijk een regressie uitvoeren. Klik op Gegevensanalyse.
Daarna Regressie en OK.
Klik vervolgens op de knop hieronder om uw uitkomstgegevens (uw Y-bereik) te identificeren.
Highlight uw uitkomstgegevens, inclusief het label. Klik vervolgens op de knop hieronder.
Klik nu op de knop hieronder om uw voorspellende gegevens (uw X-bereik) te identificeren.
Help nu zowel uw voorspellende variabele als de gekwadrateerde waarden ervan op, inclusief hun labels. Klik vervolgens op de knop die hieronder wordt weergegeven.
Klik ten slotte op het vakje voor labels en druk op OK.
We zouden resultaten moeten krijgen!
Als u hulp nodig hebt bij het lezen van deze tabel, raadpleegt u mijn gids Regressie in Excel. Anders kunnen we duidelijk zien dat de ongestandaardiseerde bèta voor consciëntieusheid -23,864 is, en de ongestandaardiseerde bèta voor de gekwadrateerde waarden ervan 3,106. Beide zijn statistisch significant (p < .001). Bij de interpretatie van kwadratische effecten interpreteren wij echter alleen de significantie van het effect van de hoogste orde – in dit geval, de gekwadrateerde voorspeller. We zouden dus zeggen dat er een significant kwadratisch effect werd gezien tussen consciëntieusheid en levenstevredenheid, en dat de relatie kon worden beschreven door een enkele curve. We zouden dan kijken naar de scatter plot tussen de twee om de vorm van de curve te identificeren, die leek op een U. Ten slotte zouden we kunnen vaststellen dat de totale R-Square van het model .78 was, wat zeer hoog is voor de sociale wetenschappen!
Natuurlijk geven de resultaten andere informatie, die nuttig kan zijn voor uw bepaalde doeleinden, maar de huidige gids behandelt alleen de basis.