Sommetider er lineær regression ikke helt tilstrækkeligt – især når vi mener, at vores observerede relationer er ikke-lineære. Derfor bør vi vende os til andre typer af regression. Denne side er en kort lektion om, hvordan man beregner en kvadratisk regression i Excel. Hvis du har spørgsmål, kan du som altid sende mig en e-mail på [email protected]!
Den typiske regressionstype er en lineær regression, som identificerer en lineær sammenhæng mellem prædiktor(er) og et resultat. Nogle gange er vores virkninger imidlertid ikke-lineære. I disse tilfælde er vi nødt til at anvende forskellige typer af regression.
En almindelig ikke-lineær sammenhæng er den kvadratiske sammenhæng, som er en sammenhæng, der beskrives af en enkelt kurve. I disse tilfælde kan forholdet mellem to variabler ligne et U eller et omvendt U. Ofte kalder vi den sidstnævnte af disse forhold (det omvendte U) for en “for meget af det gode” effekt. Det vil sige, at når den ene variabel stiger, stiger den anden også; men når man når til et vist punkt, falder forholdet igen. F.eks. kan samvittighedsfuldhed have en sammenhæng med livstilfredshed. Hvis man er hårdtarbejdende, er man generelt mere tilfreds med sit liv. Men når man når op på et vist niveau af samvittighedsfuldhed, kan ens livstilfredshed falde igen. Hvis du er for hårdtarbejdende, kan du være stresset og mindre tilfreds med dit liv.
Der er mere, der kunne siges om kvadratisk regression, men vi holder det enkelt. For at beregne en kvadratisk regression kan vi bruge Excel. Hvis du ikke har et datasæt, kan du downloade eksempeldatasættet her. I datasættet undersøger vi sammenhængen mellem samvittighedsfuldhed og livstilfredshed.
Dataene skal se nogenlunde sådan ud:
Hvis dit datasæt ser anderledes ud, skal du prøve at omformatere det, så det ligner ovenstående billede. Instruktionerne nedenfor kan være lidt forvirrende, hvis dine data ser lidt anderledes ud.
Først kunne vi oprette et spredningsdiagram over forholdet mellem samvittighedsfuldhed og livstilfredshed. Som du kan se, er der en tydelig U-form i dataene, hvilket indikerer, at der skal anvendes kvadratisk regression.
For at udføre en kvadratisk regression skal vi først oprette en ny variabel. For at gøre dette i Excel skal vi først højreklikke på vores resultatkolonne og derefter klikke på Indsæt.
Derved oprettes en ny kolonne. I denne nye kolonne ønsker vi, at hver celle skal være kvadratet på vores respektive prædiktorobservation. For at gøre dette skal du først tilføje en etiket til den første celle i kolonnen, f.eks. ConSQ. Skriv derefter “=A2^2” i den anden celle i kolonnen (uden anførselstegn). Dette vil automatisk beregne kvadratet på det, der står i den anden celle i den første kolonne.
For at gøre dette for resten af cellerne kan du dobbeltklikke nederst til højre i cellen med formlen i den. Hvis du gør det korrekt, bør den automatisk kopiere din formel til hver af de følgende celler, og dit Excel-regneark bør se ud som følger:
Når du har de kvadrerede værdier, skal vi udføre en regression som sædvanligt. Klik på Dataanalyse.
Derpå Regression og OK.
Derpå skal du klikke på knappen nedenfor for at identificere dine udfaldsdata (dit Y-område).
Hæv dine udfaldsdata, herunder etiketten. Klik derefter på knappen vist nedenfor.
Klik nu på knappen nedenfor for at identificere dine prædiktionsdata (dit X-område).
Mærk nu BÅDE din prædiktionsvariabel og dens kvadrerede værdier, herunder deres etiketter. Klik derefter på knappen vist nedenfor.
Sidst skal du klikke på feltet for Labels og trykke på OK.
Vi skulle få resultater! Yay!
Hvis du har brug for hjælp til at læse denne tabel, kan du tage et kig på min vejledning om regression i Excel. Ellers kan vi tydeligt se, at den ikke-standardiserede beta for samvittighedsfuldhed er -23,864, og den ikke-standardiserede beta for dens kvadrerede værdier er 3,106. Begge disse er statistisk signifikante (p < .001). Når vi fortolker kvadratiske effekter, fortolker vi imidlertid kun betydningen af den højeste ordenseffekt – i dette tilfælde den kvadrerede prædiktor. Så vi ville sige, at der blev set en signifikant kvadratisk effekt mellem samvittighedsfuldhed og livstilfredshed, og at forholdet kunne beskrives ved hjælp af en enkelt kurve. Vi ville derefter se på spredningsdiagrammet mellem de to for at identificere kurvens form, som lignede et U. Endelig kunne vi identificere, at modellens samlede R-kvadrat var 0,78, hvilket er meget højt for samfundsvidenskaberne!
Selvfølgelig giver resultaterne andre oplysninger, som kan være nyttige til dine bestemte formål, men den nuværende vejledning dækker kun det grundlæggende.