Poissonova regresní analýza pomocí programu SPSS Statistics

Úvod

Poissonova regrese se používá k předpovědi závislé proměnné, která se skládá z „početních údajů“, vzhledem k jedné nebo více nezávislým proměnným. Proměnná, kterou chceme předpovídat, se nazývá závislá proměnná (nebo někdy proměnná odezvy, výsledku, cílová nebo kriteriální proměnná). Proměnné, které používáme k předpovědi hodnoty závislé proměnné, se nazývají nezávislé proměnné (nebo někdy prediktor, vysvětlující nebo regresorové proměnné). Některé příklady, kde lze použít Poissonovu regresi, jsou popsány níže:

  • Příklad č. 1: Poissonovu regresi lze použít ke zkoumání počtu studentů vyloučených ze škol ve Washingtonu ve Spojených státech amerických na základě prediktorů, jako je pohlaví (dívky a chlapci), rasa (běloši, černoši, Hispánci, Asiaté/Tichomořští ostrované a američtí indiáni/původní obyvatelé Aljašky), jazyk (angličtina je jejich prvním jazykem, angličtina není jejich prvním jazykem) a status postižení (postižení a nepostižení). Zde je „počet pozastavení“ závislou proměnnou, zatímco „pohlaví“, „rasa“, „jazyk“ a „status zdravotního postižení“ jsou nominálními nezávislými proměnnými.
  • Příklad č. 2: Můžete použít Poissonovu regresi ke zkoumání počtu případů, kdy lidé v Austrálii nesplácejí splátky kreditní karty v pětiletém období na základě prediktorů, jako je pracovní status (zaměstnaný, nezaměstnaný), roční plat (v australských dolarech), věk (v letech), pohlaví (muži a ženy) a úroveň nezaměstnanosti v zemi (% nezaměstnaných). Zde je „počet nesplácených úvěrových karet“ závislou proměnnou, zatímco „pracovní status“ a „pohlaví“ jsou nominální nezávislé proměnné a „roční plat“, „věk“ a „úroveň nezaměstnanosti v zemi“ jsou spojité nezávislé proměnné.
  • Příklad č. 3: Můžete použít Poissonovu regresi ke zkoumání počtu lidí před vámi ve frontě na oddělení úrazové & pohotovosti (A&E) v nemocnici na základě prediktorů, jako je způsob příjezdu na A&E (sanitka nebo vlastní odbavení), posouzená závažnost zranění při třídění (lehké, středně těžké, těžké), denní doba a den v týdnu. Zde je „počet lidí před vámi ve frontě“ závislou proměnnou, zatímco „způsob příjezdu“ je nominální nezávislou proměnnou, „posouzená závažnost zranění“ je ordinální nezávislou proměnnou a „denní doba“ a „den v týdnu“ jsou spojité nezávislé proměnné.
  • Příklad č. 4: Můžete použít Poissonovu regresi ke zkoumání počtu studentů, kteří získají známku 1. třídy v programu MBA, na základě prediktorů, jako jsou typy volitelných předmětů, které si vybrali (převážně numerické, převážně kvalitativní, smíšené numerické a kvalitativní), a jejich průměrný prospěch při vstupu do programu. Zde je „počet studentů 1. třídy“ závislou proměnnou, zatímco „volitelné předměty“ je nominální nezávislou proměnnou a „GPA“ je spojitá nezávislá proměnná.

Po provedení Poissonovy regrese budete moci určit, které z vašich nezávislých proměnných (pokud existují) mají statisticky významný vliv na vaši závislou proměnnou. U kategoriálních nezávislých proměnných budete moci určit procentuální nárůst nebo pokles počtu jedné skupiny (např. úmrtí mezi „dětmi“ jezdícími na horských drahách) oproti jiné (např. úmrtí mezi „dospělými“ jezdícími na horských drahách). U spojitých nezávislých proměnných budete schopni interpretovat, jak jednotkové zvýšení nebo snížení této proměnné souvisí s procentuálním zvýšením nebo snížením počtů vaší závislé proměnné (např. snížení platu o 1 000 USD – nezávislé proměnné – na procentuální změnu počtu případů, kdy lidé v Austrálii nesplácejí své splátky kreditní karty – závislé proměnné).

Tento „rychlý start“ průvodce vám ukáže, jak provést Poissonovu regresi pomocí programu SPSS Statistics a jak interpretovat a vykazovat výsledky tohoto testu. Než vás však s tímto postupem seznámíme, musíte pochopit různé předpoklady, které musí vaše data splňovat, aby vám Poissonova regrese poskytla platný výsledek. Tyto předpoklady probereme dále.

Poznámka: V současné době nemáme v předplacené části našich webových stránek prémiovou verzi této příručky.

SPSS Statistics

Předpoklady

Pokud se rozhodnete analyzovat svá data pomocí Poissonovy regrese, součástí procesu je ověření, zda data, která chcete analyzovat, lze skutečně analyzovat pomocí Poissonovy regrese. Musíte to udělat, protože Poissonovu regresi je vhodné použít pouze tehdy, pokud vaše data „projdou“ pěti předpoklady, které jsou nutné k tomu, aby vám Poissonova regrese poskytla platný výsledek. V praxi vám kontrola těchto pěti předpokladů zabere při provádění Poissonovy regrese naprostou většinu času. Je však nezbytné, abyste to dělali, protože se nezřídka stává, že data jsou porušena (tj. nesplňují) jeden nebo více z těchto předpokladů. Nicméně i když vaše data některý z těchto předpokladů nesplňují, často existuje řešení, jak to překonat. Nejprve se podívejme na těchto pět předpokladů:

  • Předpoklad č. 1: Vaše závislá proměnná se skládá z počítaných dat. Počtová data se liší od dat měřených v jiných známých typech regrese (např. lineární regrese a vícenásobná regrese vyžadují závislé proměnné, které jsou měřeny na „spojité“ stupnici, binomická logistická regrese vyžaduje závislou proměnnou měřenou na „dichotomické“ stupnici, ordinální regrese vyžaduje závislou proměnnou měřenou na „ordinální“ stupnici a multinomická logistická regrese vyžaduje závislou proměnnou měřenou na „nominální“ stupnici). Naproti tomu počítané proměnné vyžadují celočíselné údaje, které musí být nulové nebo větší. Zjednodušeně si „celé číslo“ představte jako „celé“ číslo (např. 0, 1, 5, 8, 354, 888, 23400 atd.). Protože počítaná data musí být „kladná“ (tj. musí se skládat z „nezáporných“ celočíselných hodnot), nemohou se skládat z „minusových“ hodnot (např. hodnoty jako -1, -5, -8, -354, -888 a -23400 by nebyly považovány za počítaná data). Kromě toho se někdy navrhuje, aby se Poissonova regrese prováděla pouze v případě, že průměrný počet je malá hodnota (např. menší než 10). V případě velkého počtu počtů může být vhodnější jiný typ regrese (např. vícenásobná regrese, gama regrese atd.).
    Příkladem počítaných proměnných je počet letů zpožděných o více než tři hodiny na evropských letištích, počet studentů vyloučených ze škol ve Washingtonu ve Spojených státech, počet případů, kdy lidé v Austrálii nesplácí splátky kreditních karet za období pěti let, počet lidí, kteří stojí před vámi ve frontě na pohotovostním oddělení (A&E) v nemocnici, počet studentů, kteří získají známku 1. třídy (obvykle méně než 5) v programu MBA, a počet lidí, kteří zemřou při nehodách na horské dráze ve Spojených státech.
  • Předpoklad č. 2: Máte jednu nebo více nezávislých proměnných, které lze měřit na spojité, ordinální nebo nominální/dichotomické stupnici. Ordinální a nominální/dichotomické proměnné lze obecně klasifikovat jako kategoriální proměnné.
    Příkladem spojitých proměnných je doba revize (měřená v hodinách), inteligence (měřená pomocí IQ skóre), výkon u zkoušky (měřený od 0 do 100) a hmotnost (měřená v kg). Mezi příklady ordinálních proměnných patří Likertovy položky (např. sedmibodová stupnice od „rozhodně souhlasím“ po „rozhodně nesouhlasím“), mimo jiné způsoby řazení kategorií (např. tříbodová stupnice vysvětlující, jak moc se zákazníkovi líbil výrobek, od „moc ne“ po „ano, hodně“). Příkladem nominálních proměnných je pohlaví (např. dvě skupiny – muži a ženy -, takže se také označuje jako dichotomická proměnná), etnický původ (např. tři skupiny: běloši, Afroameričané a Hispánci) a profese (např. pět skupin: chirurg, lékař, zdravotní sestra, zubař, terapeut). Nezapomeňte, že ordinální a nominální/dichotomické proměnné lze obecně klasifikovat jako kategoriální proměnné. Více informací o proměnných se dozvíte v našem článku:
  • Předpoklad č. 3: Měli byste mít nezávislost pozorování. To znamená, že každé pozorování je nezávislé na ostatních pozorováních; to znamená, že jedno pozorování nemůže poskytovat žádné informace o jiném pozorování. To je velmi důležitý předpoklad. Nedostatek nezávislých pozorování je většinou problémem návrhu studie. Jednou z metod testování možnosti nezávislosti pozorování je porovnat standardní chyby založené na modelu s robustními chybami a zjistit, zda existují velké rozdíly.
  • Předpoklad č. 4: Rozdělení počtů (podmíněné modelem) se řídí Poissonovým rozdělením. Jedním z důsledků toho je, že pozorované a očekávané počty by měly být stejné (ve skutečnosti jen velmi podobné). V podstatě to znamená, že model dobře předpovídá pozorované počty. To lze testovat mnoha způsoby, ale jednou z metod je vypočítat očekávané počty a vynést je do grafu s pozorovanými počty a zjistit, zda jsou podobné.
  • Předpoklad č. 5: Střední hodnota a rozptyl modelu jsou shodné. To je důsledek předpokladu č. 4; že existuje Poissonovo rozdělení. U Poissonova rozdělení má rozptyl stejnou hodnotu jako střední hodnota. Pokud splníte tento předpoklad, máte ekvidisperzi. Často tomu tak však není a vaše data jsou buď nedostatečně, nebo příliš rozptýlená, přičemž častějším problémem je přílišný rozptyl. Existuje řada metod, které můžete použít k posouzení nadměrného rozptylu. Jednou z metod je posouzení Pearsonovy statistiky rozptylu.

Předpoklady č. 3, 4 a 5 můžete ověřit pomocí programu SPSS Statistics. Nejprve je třeba zkontrolovat předpoklady č. 1 a č. 2 a teprve poté přejít k předpokladům č. 3, č. 4 a č. 5. Jen nezapomeňte, že pokud neprovedete statistické testy těchto předpokladů správně, výsledky, které získáte při provádění Poissonovy regrese, nemusí být platné.

Pokud vaše data porušila předpoklad č. 5, což je při provádění Poissonovy regrese velmi časté, musíte nejprve zkontrolovat, zda máte „zjevný Poissonův nadměrný rozptyl“. Zjevný Poissonův nadměrný rozptyl je případ, kdy jste model nespecifikovali správně tak, že se data jeví jako nadměrně rozptýlená. Pokud tedy váš Poissonův model zpočátku porušuje předpoklad rovnoměrného rozptylu, měli byste nejprve provést řadu úprav svého Poissonova modelu a zkontrolovat, zda je skutečně nadměrně rozptýlen. To vyžaduje, abyste provedli šest kontrol svého modelu/dat: (a) Zahrnuje váš Poissonův model všechny důležité prediktory?; (b) Obsahují vaše data odlehlé hodnoty?; (c) Zahrnuje vaše Poissonova regrese všechny relevantní interakční členy?; (d) Je třeba některý z vašich prediktorů transformovat?; (e) Vyžaduje váš Poissonův model více dat a/nebo jsou vaše data příliš řídká?; a (f) Máte chybějící hodnoty, které nejsou náhodně chybějící (MAR)?

V části Postup ilustrujeme postup SPSS Statistics pro provedení Poissonovy regrese za předpokladu, že nebyly porušeny žádné předpoklady. Nejprve představíme příklad, který je v této příručce použit.

SPSS Statistics

Příklad &Nastavení v SPSS Statistics

Ředitel výzkumu malé univerzity chce posoudit, zda zkušenosti akademického pracovníka a čas, který má k dispozici na provádění výzkumu, ovlivňují počet jím vytvořených publikací. Proto požádá náhodný vzorek 21 akademiků z této univerzity, aby se zúčastnili výzkumu: Deset z nich jsou zkušení akademičtí pracovníci a jedenáct jsou noví akademičtí pracovníci. Zaznamenává se počet hodin, které strávili výzkumem v posledních 12 měsících, a počet recenzovaných publikací, které vytvořili.

Pro nastavení designu této studie v programu SPSS Statistics jsme vytvořili tři proměnné: (1) no_of_publications, což je počet publikací, které akademik publikoval v recenzovaných časopisech za posledních 12 měsíců; (2) experience_of_academic, která odráží, zda je akademik zkušený (tj. pracuje v akademické sféře 10 a více let, a je tedy klasifikován jako „zkušený akademik“), nebo se akademikem stal nedávno (tj, pracoval v akademické sféře méně než 3 roky, ale alespoň jeden rok, a je proto klasifikován jako „Nedávný akademik“); a (3) no_of_weekly_hours, což je počet hodin, které má akademik týdně k dispozici pro práci na výzkumu.

SPSS Statistics

Testovací postup v SPSS Statistics

Následujících 13 kroků vám ukáže, jak analyzovat data pomocí Poissonovy regrese v SPSS Statistics, pokud nebyl porušen žádný z pěti předpokladů v předchozí části Předpoklady. Na konci těchto 13 kroků vám ukážeme, jak interpretovat výsledky vaší Poissonovy regrese.

  1. Klikněte na Analyze > Generalized Linear Models > Generalized Linear Models… v hlavní nabídce, jak je znázorněno níže:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

    Zobrazí se vám dialogové okno Generalized Linear Models níže:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

  2. V oblasti vyberte Poissonův loglineární, jak je uvedeno níže:

    Publikováno s písemným svolením společnosti SPSS Statistics, IBM Corporation.

    Poznámka: Zatímco pro provedení Poissonovy regrese je standardní zvolit v oblasti možnost Poisson loglinear, můžete také zvolit spuštění vlastní Poissonovy regrese výběrem možnosti Custom v oblasti a následným určením typu Poissonova modelu, který chcete spustit, pomocí možností Distribution:, Link function: a -Parameter-.

  3. Zvolte kartu . Zobrazí se následující dialogové okno:

    Publikováno s písemným svolením společnosti SPSS Statistics, IBM Corporation.

  4. Přeneste závislou proměnnou no_of_publications do pole Dependent variable: (Závislá proměnná:) v oblasti pomocí tlačítka , jak je uvedeno níže:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

  5. Zvolte kartu . Zobrazí se následující dialogové okno:

    Published with written permission from SPSS Statistics, IBM Corporation.

  6. Přesuňte kategoriální nezávislou proměnnou, experience_of_academic, do pole Factors: a spojitou nezávislou proměnnou, no_of_weekly_hours, do pole Covariates: pomocí tlačítek , jak je uvedeno níže:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

    Poznámka 1: Pokud máte pořadové nezávislé proměnné, musíte se rozhodnout, zda s nimi budete zacházet jako s kategoriálními a zadáte je do pole Faktory:, nebo s nimi budete zacházet jako se spojitými a zadáte je do pole Kovariáty:. Nelze je zadat do Poissonovy regrese jako ordinální proměnné.

    Poznámka 2: I když je typické zadávat spojité nezávislé proměnné do pole Covariates:, je možné místo toho zadat ordinální nezávislé proměnné. Pokud se však pro tento postup rozhodnete, bude vaše ordinální nezávislá proměnná považována za spojitou.

    Poznámka 3: Pokud kliknete na tlačítko , zobrazí se následující dialogové okno:

    V oblasti -Category Order for Factors- (Pořadí kategorií pro faktory) si můžete vybrat mezi možnostmi Ascending (Vzestupně), Descending (Sestupně) a Use data order (Použít pořadí dat). Ty jsou užitečné, protože SPSS Statistics automaticky změní vaše kategoriální proměnné na fiktivní proměnné. Pokud nejste obeznámeni s fiktivními proměnnými, může to trochu zkomplikovat interpretaci výstupu z Poissonovy regrese pro každou ze skupin vašich kategoriálních proměnných. Proto provedení změn v možnostech v oblasti -Category Order for Factors- může usnadnit interpretaci výstupu.

  7. Zvolte kartu . Zobrazí se následující dialogové okno:

    Publikováno s písemným svolením společnosti SPSS Statistics, IBM Corporation.

  8. Ponechte výchozí hodnotu v oblasti -Build Term(s)- a přeneste kategoriální a spojité nezávislé proměnné, experience_of_academic a no_of_weekly_hours, z pole Factors and Covariates: do pole Model: pomocí tlačítka , jak je uvedeno níže:

    Publikováno s písemným svolením společnosti SPSS Statistics, IBM Corporation.

    Poznámka 1: Právě v dialogovém okně sestavujete svůj Poissonův model. Zejména určujete, jaké máte hlavní efekty (volba ), a také to, zda očekáváte, že mezi vašimi nezávislými proměnnými budou nějaké interakce (volba ). Pokud máte podezření, že mezi vašimi nezávislými proměnnými existují interakce, je jejich zahrnutí do modelu důležité nejen pro zlepšení predikce vašeho modelu, ale také proto, abyste se vyhnuli problémům s nadměrným rozptylem, jak bylo zdůrazněno v části Předpoklady dříve.
    Přestože uvádíme příklad pro velmi jednoduchý model s jediným hlavním účinkem (mezi kategoriální a spojitou nezávislou proměnnou, zkušenost_z_akademie a ne_týdenní_hodiny), můžete snadno zadat složitější modely pomocí , , . a v oblasti -Build Term(s)- v závislosti na typu hlavních efektů a interakcí, které máte ve svém modelu.

    Poznámka 2: Do modelu můžete také zabudovat vnořené termíny jejich přidáním do pole Term: v oblasti -Build Nested Term-. V tomto modelu nemáme vnořené efekty, ale existuje mnoho scénářů, kdy můžete mít ve svém modelu vnořené termíny.

  9. Zvolte kartu . Zobrazí se následující dialogové okno:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

  10. Ponechte vybrané výchozí možnosti.

    Poznámka: V oblasti -Odhad parametrů- můžete vybrat řadu různých možností, včetně možnosti zvolit jinou: (a) metodu parametrů měřítka (tj. nebo místo v poli Metoda parametrů měřítka:), což lze zvážit pro řešení problémů s nadměrným rozptylem, a (b) kovarianční matici (tj. robustní odhad místo odhadu založeného na modelu v oblasti -Kovarianční matice-), což představuje další potenciální možnost (mimo jiné) pro řešení problémů s nadměrným rozptylem.
    V oblasti -Iterations- můžete také provést řadu specifikací, abyste se vypořádali s problémy nekonvergence vašeho Poissonova modelu.

  11. Zvolte kartu . Zobrazí se následující dialogové okno:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

  12. V oblasti vyberte možnost Zahrnout odhady exponenciálních parametrů, jak je uvedeno níže:

    Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

    Poznámka 1: V oblasti si můžete vybrat mezi Waldovým a pravděpodobnostním poměrem na základě faktorů, jako je velikost vzorku a důsledky, které to může mít pro přesnost testování statistické významnosti.
    V oblasti může být užitečný také test Lagrangeova multiplikátoru, který umožňuje určit, zda je pro vaše data vhodný Poissonův model (ačkoli jej nelze provést pomocí postupu Poissonovy regrese).

    Poznámka 2: Na kartách a si můžete vybrat také celou řadu dalších možností. Patří mezi ně možnosti, které jsou důležité při zkoumání rozdílů mezi skupinami vašich kategoriálních proměnných a také při testování předpokladů Poissonovy regrese, jak bylo uvedeno dříve v části Předpoklady.

  13. Klikněte na tlačítko . Tím se vygeneruje výstup.

SPSS Statistics

Interpretace a vykazování výstupů Poissonovy regresní analýzy

SPSS Statistics vygeneruje pro Poissonovu regresní analýzu poměrně dost výstupních tabulek. V této části vám ukážeme osm hlavních tabulek potřebných k pochopení výsledků postupu Poissonovy regrese za předpokladu, že nebyly porušeny žádné předpoklady.

Informace o modelu a proměnných

První tabulkou ve výstupu je tabulka Informace o modelu (jak je uvedeno níže). Ta potvrzuje, že závislou proměnnou je „Počet publikací“, rozdělení pravděpodobnosti je „Poissonovo“ a spojovací funkcí je přirozený logaritmus (tj. „Log“). Pokud provádíte Poissonovu regresi na vlastních datech, název závislé proměnné bude jiný, ale pravděpodobnostní rozdělení a spojovací funkce budou stejné.

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Druhá tabulka, Přehled zpracování případů, vám ukáže, kolik případů (např. počet publikací) bylo zpracováno, subjektů) byly zahrnuty do vaší analýzy (řádek „Zahrnuto“) a kolik jich nebylo zahrnuto (řádek „Vyloučeno“), jakož i procentuální podíl obou. Řádek „Excluded“ si můžete představit jako označení případů (např. subjektů), u kterých chyběla jedna nebo více hodnot. Jak vidíte níže, v této analýze bylo 21 subjektů, přičemž žádný subjekt nebyl vyloučen (tj. žádné chybějící hodnoty).

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Tabulka Informace o kategoriální proměnné zvýrazňuje počet a procento případů (např. subjektů) v každé skupině každé nezávislé kategoriální proměnné ve vaší analýze. V této analýze je pouze jedna kategoriální nezávislá proměnná (známá také jako „faktor“), kterou byla zkušenost_z_akademie. Můžete si všimnout, že skupiny jsou poměrně vyrovnané co do počtu mezi oběma skupinami (tj. 10 versus 11). Vysoce nevyvážené počty skupin mohou způsobit problémy s přizpůsobením modelu, ale vidíme, že zde žádný problém není.

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Tabulka informací o spojité proměnné může poskytnout základní kontrolu dat na případné problémy, ale je méně užitečná než jiné popisné statistiky, které můžete spustit samostatně před spuštěním Poissonovy regrese. Nejlepší, co můžete z této tabulky získat, je pochopení toho, zda ve vaší analýze nedochází k nadměrnému rozptylu (tj. předpoklad č. 5 Poissonovy regrese). To můžete provést tak, že zvážíte poměr rozptylu (čtverec sloupce „Std. Deviation“) k průměru (sloupec „Mean“) pro závislou proměnnou. Tyto údaje si můžete prohlédnout níže:

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Průměr je 2,29 a rozptyl je 2,81 (1,677582), což je poměr 2,81 ÷ 2,29 = 1,23. V tomto případě je poměr 2,81 ÷ 2,29 = 1,23. Poissonovo rozdělení předpokládá poměr 1 (tj. střední hodnota a rozptyl jsou stejné). Vidíme tedy, že před přidáním jakýchkoli vysvětlujících proměnných existuje malý nadměrný rozptyl. Tento předpoklad však musíme ověřit po přidání všech nezávislých proměnných do Poissonovy regrese. O tom pojednáme v následující části.

Zjištění, jak dobře model vyhovuje

Tabulka Goodness of Fit poskytuje mnoho měr, které lze použít k posouzení, jak dobře model vyhovuje. My se však zaměříme na hodnotu ve sloupci „Value/df“ pro řádek „Pearson Chi-Square“, která je v tomto příkladu 1,108, jak je uvedeno níže:

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Hodnota 1 znamená ekvidisperzi, zatímco hodnoty vyšší než 1 znamenají nadměrnou disperzi a hodnoty nižší než 1 znamenají nedostatečnou disperzi. Nejčastějším typem porušení předpokladu ekvidisperze je nadměrný rozptyl. Při tak malé velikosti vzorku v tomto příkladu je nepravděpodobné, že by hodnota 1,108 představovala závažné porušení tohoto předpokladu.

Tabulka Omnibus Test zapadá někam mezi tuto a následující část. Jedná se o test poměru pravděpodobnosti, zda všechny nezávislé proměnné dohromady zlepšují model oproti modelu pouze s interceptem (tj. bez přidání nezávislých proměnných). Máme-li v našem příkladovém modelu všechny nezávislé proměnné, máme p-hodnotu .006 (tj. p = .006), což znamená, že celkový model je statisticky významný, jak je uvedeno níže ve sloupci „Sig.“:

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Teď, když víte, že přidání všech nezávislých proměnných vytváří statisticky významný model, budete chtít vědět, které konkrétní nezávislé proměnné jsou statisticky významné. O tom pojednává následující část.

Efekty modelu a statistická významnost nezávislých proměnných

Tabulka Testy efektů modelu (jak je uvedeno níže) zobrazuje statistickou významnost každé z nezávislých proměnných ve sloupci „Sig.“:

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Obvykle vás nezajímá intercept modelu. Vidíme však, že zkušenost akademika nebyla statisticky významná (p = .644), ale počet odpracovaných hodin týdně statisticky významný byl (p = .030). Tato tabulka je užitečná především pro kategoriální nezávislé proměnné, protože je to jediná tabulka, která zohledňuje celkový vliv kategoriální proměnné, na rozdíl od tabulky Odhady parametrů, jak je uvedeno níže:

Publikováno s písemným svolením SPSS Statistics, IBM Corporation.

Tato tabulka poskytuje jak odhady koeficientů (sloupec „B“) Poissonovy regrese, tak exponované hodnoty koeficientů (sloupec „Exp(B)“). Obvykle mají větší vypovídací hodnotu ty druhé. Tyto exponované hodnoty lze interpretovat více způsoby a jeden z nich vám ukážeme v této příručce. Vezměme si například počet hodin odpracovaných týdně (tj. řádek „no_of_weekly_hours“). Exponovaná hodnota je 1,044. To znamená, že počet publikací (tj. počet závislé proměnné) bude 1,044krát větší za každou další odpracovanou hodinu týdně. Jinak se to dá vyjádřit tak, že za každou hodinu práce týdně navíc se počet publikací zvýší o 4,4 %. Podobnou interpretaci lze provést i pro kategoriální proměnnou.

Všechno dohromady

Výsledky počtu hodin odpracovaných týdně byste mohli zapsat takto:

  • Všeobecně

Byla provedena Poissonova regrese s cílem předpovědět počet publikací, které akademik publikuje za posledních 12 měsíců, na základě zkušeností akademika a počtu hodin, které akademik každý týden stráví prací na výzkumu. Za každou hodinu navíc odpracovanou týdně na výzkumu bylo publikováno 1,044 (95% CI, 1,004 až 1,085) krát více publikací, což je statisticky významný výsledek, p = .030.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.