Někdy lineární regrese nestačí – zejména pokud se domníváme, že naše pozorované vztahy jsou nelineární. Z tohoto důvodu bychom se měli obrátit na jiné typy regrese. Tato stránka je stručnou lekcí, jak vypočítat kvadratickou regresi v aplikaci Excel. Jako vždy mi v případě dotazů napište na [email protected]!
Typickým typem regrese je lineární regrese, která zjišťuje lineární vztah mezi prediktorem (prediktory) a výsledkem. Někdy jsou však naše účinky nelineární. V těchto případech musíme použít jiné typy regrese.
Obvyklým nelineárním vztahem je kvadratický vztah, což je vztah, který je popsán jednou křivkou. V těchto případech může vztah mezi dvěma proměnnými vypadat jako U nebo obrácené U. Často nazýváme druhý z těchto vztahů (obrácené U) efektem „příliš mnoho dobrého“. To znamená, že když jedna proměnná stoupá, pak stoupá i druhá; jakmile se však dostanete do určitého bodu, vztah se vrátí zpět dolů. Například svědomitost může souviset s životní spokojeností. Pokud jste pracovití, jste obecně spokojenější se svým životem. Jakmile však dosáhnete určité úrovně svědomitosti, může vaše životní spokojenost opět klesnout. Pokud jste příliš pracovití, pak můžete být ve stresu a méně spokojeni se svým životem.
O kvadratické regresi by se toho dalo říci více, ale my to zjednodušíme. K výpočtu kvadratické regrese můžeme použít program Excel. Pokud nemáte k dispozici datovou sadu, můžete si stáhnout ukázkovou datovou sadu zde. V datasetu zkoumáme vztah svědomitosti a životní spokojenosti.
Data by měla vypadat nějak takto:
Pokud váš dataset vypadá jinak, zkuste ho přeformátovat tak, aby se podobal obrázku výše. Následující pokyny mohou být trochu matoucí, pokud vaše data vypadají trochu jinak.
Nejprve bychom mohli vytvořit graf rozptylu vztahu mezi svědomitostí a životní spokojeností. Jak vidíte, data mají jasný tvar písmene U, což naznačuje, že je třeba použít kvadratickou regresi.
Chceme-li provést kvadratickou regresi, musíme nejprve vytvořit novou proměnnou. Za tímto účelem bychom měli v aplikaci Excel nejprve kliknout pravým tlačítkem myši na náš výsledný sloupec a poté kliknout na možnost Vložit.
Tím vytvoříme nový sloupec. V tomto novém sloupci chceme, aby každá buňka byla čtvercem našeho příslušného prediktivního pozorování. Za tímto účelem nejprve přidejte do první buňky sloupce popisek, například ConSQ. Poté do druhé buňky sloupce napište „=A2^2“ (bez uvozovek). Tím se automaticky vypočítá čtverec toho, co je ve druhé buňce prvního sloupce.
Chcete-li to provést pro ostatní buňky, můžete dvakrát kliknout na pravý dolní roh buňky, v níž je vzorec. Pokud to uděláte správně, měl by se vzorec automaticky zkopírovat do každé z následujících buněk a váš tabulkový procesor Excel by měl vypadat následovně:
Jakmile budete mít čtvercové hodnoty, provedeme jako obvykle regresi. Klikněte na Analýza dat.
Tedy Regrese a OK.
Poté klikněte na tlačítko níže, abyste identifikovali svá výsledná data (váš rozsah Y).
Zvýrazněte svá výsledná data, včetně označení. Poté klikněte na níže uvedené tlačítko.
Nyní klikněte na níže uvedené tlačítko pro identifikaci vašich predikčních dat (vašeho X-Range).
Nyní zvýrazněte OBĚ vaše predikční proměnné a jejich kvadratické hodnoty, včetně jejich popisků. Poté klikněte na tlačítko zobrazené níže.
Nakonec klikněte na políčko Labels a stiskněte OK.
Měli bychom dostat výsledky! Hurá!
Pokud potřebujete pomoc se čtením této tabulky, podívejte se na mého průvodce Regrese v Excelu. Jinak jasně vidíme, že nestandardizovaná beta pro svědomitost je -23,864 a nestandardizovaná beta pro její čtvercové hodnoty je 3,106. To znamená, že v případě svědomitosti je beta -23,864 a v případě jejího čtverce je beta 3,106. Obě tyto hodnoty jsou statisticky významné (p < .001). Při interpretaci kvadratických efektů však interpretujeme pouze významnost efektu nejvyššího řádu – v tomto případě kvadratického prediktoru. Řekli bychom tedy, že mezi svědomitostí a životní spokojeností byl pozorován významný kvadratický efekt a vztah lze popsat jedinou křivkou. Pak bychom se podívali na graf rozptylu mezi nimi a identifikovali tvar křivky, který připomínal písmeno U. Nakonec bychom mohli identifikovat, že celkový R-kvadrát modelu je 0,78, což je na poměry společenských věd velmi vysoká hodnota!“
Výsledky samozřejmě poskytují další informace, které mohou být užitečné pro vaše určité účely, ale tento průvodce se zabývá pouze základními informacemi.