Joskus lineaarinen regressio ei aivan riitä – erityisesti silloin, kun uskomme, että havaitut suhteet ovat epälineaarisia. Tästä syystä meidän tulisi kääntyä muiden regressiotyyppien puoleen. Tällä sivulla on lyhyt oppitunti siitä, miten kvadraattinen regressio lasketaan Excelissä. Kuten aina, jos sinulla on kysyttävää, lähetä minulle sähköpostia osoitteeseen [email protected]!
Tyypillinen regressiotyyppi on lineaarinen regressio, jossa tunnistetaan lineaarinen suhde ennustajan (ennustajien) ja lopputuloksen välillä. Joskus vaikutukset ovat kuitenkin epälineaarisia. Näissä tapauksissa meidän on sovellettava erilaisia regressiotyyppejä.
Yleinen epälineaarinen suhde on kvadraattinen suhde, joka on suhde, jota kuvaa yksi käyrä. Näissä tapauksissa kahden muuttujan välinen suhde voi näyttää U:lta tai ylösalaisin olevalta U:lta. Usein kutsumme jälkimmäistä näistä suhteista (ylösalaisin olevaa U:ta) ”liikaa hyvää” -ilmiöksi. Toisin sanoen, kun yksi muuttuja nousee, myös toinen muuttuja nousee, mutta kun päästään tiettyyn pisteeseen, suhde kääntyy takaisin laskuun. Esimerkiksi tunnollisuus voi olla yhteydessä elämäntyytyväisyyteen. Jos olet ahkera, olet yleensä tyytyväisempi elämääsi. Kun kuitenkin saavutat tietyn tason tunnollisuudessa, elämäntyytyväisyytesi saattaa laskea. Jos olet liian ahkera, saatat olla stressaantunut ja tyytymättömämpi elämääsi.
Kvadraattisesta regressiosta voisi sanoa enemmänkin, mutta pidämme sen yksinkertaisena. Kvadraattisen regression laskemiseen voimme käyttää Exceliä. Jos sinulla ei ole tietokokonaisuutta, voit ladata esimerkkitietokokonaisuuden täältä. Aineistossa tutkimme tunnollisuuden ja elämäntyytyväisyyden suhdetta.
Aineiston pitäisi näyttää jotakuinkin tältä:
Jos aineistosi näyttää erilaiselta, yritä muotoilla se uudelleen yllä olevan kuvan mukaiseksi. Alla olevat ohjeet saattavat olla hieman hämmentäviä, jos datasi näyttää hieman erilaiselta.
Ensin voisimme luoda hajontakuvion tunnollisuuden ja elämäntyytyväisyyden välisestä suhteesta. Kuten näet, datassa on selvä U-muoto, mikä viittaa siihen, että tulisi soveltaa kvadraattista regressiota.
Tehdäksemme kvadraattisen regression, meidän on ensin luotava uusi muuttuja. Tätä varten Excelissä meidän on ensin napsautettava hiiren kakkospainikkeella tulossarakettamme ja napsautettava sitten Insert.
Tämä luo uuden sarakkeen. Tässä uudessa sarakkeessa haluamme, että jokainen solu on vastaavan ennustehavaintomme neliö. Tätä varten lisää ensin sarakkeen ensimmäiseen soluun merkintä, esimerkiksi ConSQ. Kirjoita sitten ”=A2^2” sarakkeen toiseen soluun (ilman lainausmerkkejä). Tämä laskee automaattisesti sen neliön, joka on ensimmäisen sarakkeen toisessa solussa.
Tehdäksesi tämän lopuille soluille voit kaksoisnapsauttaa sen solun oikeaa alakulmaa, jossa kaava on. Jos teet sen oikein, sen pitäisi automaattisesti kopioida kaavasi jokaiseen seuraavaan soluun, ja Excel-taulukkosi pitäisi näyttää seuraavalta:
Kun sinulla on neliöarvot, suoritamme regression tavalliseen tapaan. Napsauta Data Analysis.
Sitten Regression ja OK.
Sitten, napsauta alla olevaa painiketta tunnistaaksesi tulosaineistosi (Y-alueesi).
Korosta tulosaineistosi, mukaan lukien merkintä. Napsauta sitten alla olevaa painiketta.
Nyt napsauta alla olevaa painiketta yksilöidäksesi ennustetietosi (X-alueesi).
Nyt korosta KOKONAISUUDESTA ennustemuuttujasi ja sen neliölliset arvot, mukaan lukien niiden tarrat. Napsauta sitten alla näkyvää painiketta.
Viimeiseksi napsauta Labels-kenttää ja paina OK-painiketta.
Meidän pitäisi saada tuloksia! Jee!
Jos tarvitset apua tämän taulukon lukemisessa, tutustu Regression in Excel -oppaaseen. Muuten voimme selvästi nähdä, että tunnollisuuden vakioimaton beeta on -23,864 ja sen neliöarvojen vakioimaton beeta on 3,106. Nämä molemmat ovat tilastollisesti merkitseviä (p < .001). Kun tulkitsemme kvadraattisia vaikutuksia, tulkitsemme kuitenkin vain korkeimman asteen vaikutuksen – tässä tapauksessa neliöennusteen – merkitsevyyttä. Sanoisimme siis, että tunnollisuuden ja elämäntyytyväisyyden välillä havaittiin merkitsevä kvadraattinen vaikutus, ja suhdetta voitaisiin kuvata yhdellä käyrällä. Tämän jälkeen tarkastelisimme näiden kahden välillä olevaa hajontakuviota tunnistaaksemme käyrän muodon, joka muistutti U:ta. Lopuksi voisimme todeta, että mallin yleinen R-neliö oli .78, mikä on erittäin korkea yhteiskuntatieteissä!
Tulokset antavat tietysti muutakin tietoa, joka voi olla hyödyllistä tietyissä tarkoituksissanne, mutta nykyinen opas kattaa vain perusasiat.