Poisson-regressziós elemzés az SPSS Statistics segítségével

Bevezetés

A Poisson-regressziót egy vagy több független változó esetén egy “számlálási adatokból” álló függő változó előrejelzésére használják. A megjósolni kívánt változót függő változónak (vagy néha válasz-, eredmény-, cél- vagy kritériumváltozónak) nevezzük. A függő változó értékének előrejelzésére használt változókat független változóknak (vagy néha előrejelző, magyarázó vagy regresszor változóknak) nevezzük. Az alábbiakban néhány példát mutatunk be, ahol a Poisson-regresszió alkalmazható:

  • 1. példa: A Poisson-regresszió segítségével megvizsgálhatjuk az Egyesült Államokban, Washingtonban található iskolák által felfüggesztett tanulók számát olyan előrejelző változók alapján, mint a nem (lányok és fiúk), a faj (fehér, fekete, spanyolajkú, ázsiai/csendes-óceáni szigetlakó és amerikai indián/alaszkai őslakos), a nyelv (angol az első nyelvük, angol nem az első nyelvük) és a fogyatékossági státusz (fogyatékos és nem fogyatékos). Itt a “felfüggesztések száma” a függő változó, míg a “nem”, a “faj”, a “nyelv” és a “fogyatékossági státusz” mind nominális független változók.
  • 2. példa: Poisson-regresszióval megvizsgálhatja, hogy Ausztráliában az emberek hányszor nem fizetik vissza hitelkártyájuk törlesztését egy ötéves időszak alatt olyan előrejelző tényezők alapján, mint a munkahelyi státusz (alkalmazott, munkanélküli), éves fizetés (ausztrál dollárban), életkor (években), nem (férfi és nő) és az ország munkanélküliségi szintje (% munkanélküli). Itt a “hitelkártya-visszafizetési mulasztások száma” a függő változó, míg a “munkahelyi státusz” és a “nem” nominális független változók, az “éves fizetés”, az “életkor” és az “ország munkanélküliségi szintje” pedig folyamatos független változók.
  • 3. példa: Poisson-regresszióval megvizsgálhatná, hogy egy kórház baleseti & sürgősségi osztályán (A&E) hányan állnak előttünk a sorban olyan prediktív tényezők alapján, mint az A&E-be érkezés módja (mentő vagy saját bejelentkezés), a sérülésnek a triázs során megállapított súlyossága (enyhe, közepes, súlyos), a napszak és a hét napja. Itt a “sorban előtted állók száma” a függő változó, míg az “érkezés módja” egy nominális független változó, a “sérülés súlyosságának értékelése” egy ordinális független változó, a “napszak” és a “hét napja” pedig folyamatos független változók.
  • 4. példa: Poisson-regresszióval megvizsgálhatná, hogy egy MBA-programban hány hallgató kap első osztályú jegyet olyan prediktív tényezők alapján, mint a választott választható kurzusok típusa (főleg numerikus, főleg kvalitatív, numerikus és kvalitatív vegyesen), valamint a programba való belépéskor elért tanulmányi átlaguk. Itt az “első osztályos hallgatók száma” a függő változó, míg a “választható kurzusok” egy nominális független változó, a “GPA” pedig egy folytonos független változó.

A Poisson-regresszió elvégzése után meg tudja határozni, hogy a független változók közül (ha van ilyen) melyeknek van statisztikailag szignifikáns hatása a függő változóra. A kategorikus független változók esetében meg tudja majd határozni az egyik csoport (pl. a hullámvasúton utazó “gyerekek” körében bekövetkezett halálesetek) százalékos növekedését vagy csökkenését egy másik csoporthoz képest (pl. a hullámvasúton utazó “felnőttek” körében bekövetkezett halálesetek). Folyamatos független változók esetén képes lesz értelmezni, hogy az adott változó egyetlen egységnyi növekedése vagy csökkenése hogyan jár együtt a függő változó számlálásainak százalékos növekedésével vagy csökkenésével (pl. az 1000 dolláros fizetéscsökkenés – a független változó – a hitelkártya-törlesztési késedelmek számának – a függő változó – százalékos változására).

Ez a “gyors útmutató” megmutatja, hogyan végezhet Poisson-regressziót az SPSS Statistics segítségével, valamint hogyan értelmezheti és jelentheti a vizsgálat eredményeit. Mielőtt azonban bemutatnánk ezt az eljárást, meg kell értenie a különböző feltételezéseket, amelyeknek az adatainak meg kell felelniük ahhoz, hogy a Poisson-regresszió érvényes eredményt adjon. A következőkben ezeket a feltételezéseket tárgyaljuk.

Figyelem: Ennek az útmutatónak jelenleg nincs prémium verziója honlapunk előfizetéses részében.

SPSS Statistics

Feltételezések

Amikor úgy dönt, hogy adatait Poisson-regresszióval elemzi, a folyamat része annak ellenőrzése, hogy az elemezni kívánt adatok valóban elemezhetőek-e Poisson-regresszióval. Ezt azért kell megtennie, mert a Poisson-regresszió használata csak akkor megfelelő, ha az adatai “átmennek” öt feltételezésen, amelyek szükségesek ahhoz, hogy a Poisson-regresszió érvényes eredményt adjon. A gyakorlatban ennek az öt feltételezésnek az ellenőrzése veszi el az Ön idejének túlnyomó többségét a Poisson-regresszió végrehajtása során. Ennek elvégzése azonban elengedhetetlen, mert nem ritka, hogy az adatok megsértik (azaz nem felelnek meg) e feltételezések közül egyet vagy többet. Azonban még akkor is, ha az adatai nem teljesítik e feltételezések valamelyikét, gyakran van megoldás ennek áthidalására. Először is nézzük meg ezt az öt feltételezést:

  • 1. feltételezés: A függő változója számlálási adatokból áll. A számlálási adatok különböznek a regresszió más jól ismert típusaiban mért adatoktól (pl. a lineáris regresszió és a többszörös regresszió “folytonos” skálán mért függő változókat, a binomiális logisztikus regresszió “dichotóm” skálán mért függő változót, az ordinális regresszió “ordinális” skálán mért függő változót, a multinomiális logisztikus regresszió pedig “nominális” skálán mért függő változót igényel). Ezzel szemben a számláló változók egész számú adatokat igényelnek, amelyeknek nullának vagy annál nagyobbnak kell lenniük. Egyszerűen fogalmazva, az “egész szám” egy “egész” szám (pl. 0, 1, 5, 8, 354, 888, 23400 stb.). Továbbá, mivel a számlálási adatoknak “pozitívnak” kell lenniük (azaz “nem negatív” egész szám értékekből kell állniuk), nem állhatnak “mínusz” értékekből (pl. az olyan értékek, mint -1, -5, -8, -354, -888 és -23400 nem tekinthetők számlálási adatoknak). Továbbá néha azt javasolják, hogy a Poisson-regressziót csak akkor végezzük el, ha a számlálási átlag kis érték (pl. 10-nél kisebb). Nagyszámú számlálás esetén más típusú regresszió lehet megfelelőbb (pl. többszörös regresszió, gamma-regresszió stb.).
    Példák a számlálóváltozókra: az európai repülőtereken három óránál többet késő járatok száma, az Egyesült Államokban a washingtoni iskolák által felfüggesztett diákok száma, Ausztráliában az emberek hitelkártya-törlesztési késedelmeinek száma öt év alatt, hányan állnak előttünk a kórház baleseti & sürgősségi osztályán (A&E) a sorban, hány diák kap első osztályzatot (jellemzően kevesebb, mint 5) egy MBA-programban, és hányan halnak meg hullámvasút-balesetben az Egyesült Államokban.
  • 2. feltételezés: Van egy vagy több független változó, amelyek folyamatos, ordinális vagy nominális/dichotóm skálán mérhetők. Az ordinális és nominális/dichotóm változókat nagyjából a kategorikus változók közé sorolhatjuk.
    Példák a folytonos változókra: az átdolgozási idő (órákban mérve), az intelligencia (IQ pontszámmal mérve), a vizsgateljesítmény (0-tól 100-ig mérve) és a testsúly (kg-ban mérve). Az ordinális változók példái közé tartoznak a Likert-elemek (pl. egy 7 pontos skála a “teljes mértékben egyetértek” és a “teljes mértékben nem értek egyet” között), a kategóriák rangsorolásának egyéb módjai között (pl. egy 3 pontos skála, amely azt fejezi ki, hogy egy ügyfélnek mennyire tetszett egy termék, a “Nem nagyon” és az “Igen, nagyon” között). A nominális változókra példa a nem (pl. két csoport – férfi és nő – tehát dichotóm változóként is ismert), az etnikai hovatartozás (pl. három csoport: kaukázusi, afroamerikai és spanyolajkú) és a szakma (pl. öt csoport: sebész, orvos, ápoló, fogorvos, terapeuta). Ne feledje, hogy az ordinális és nominális/dichotóm változókat nagyjából kategorikus változóknak lehet minősíteni. A változókról többet megtudhat cikkünkben: A változók típusai.
  • 3. feltételezés: A megfigyeléseknek függetlennek kell lenniük. Ez azt jelenti, hogy minden megfigyelés független a többi megfigyeléstől, vagyis az egyik megfigyelés nem adhat információt egy másik megfigyelésről. Ez egy nagyon fontos feltételezés. A független megfigyelések hiánya többnyire tanulmánytervezési probléma. A megfigyelések függetlenségének lehetőségére vonatkozó tesztelés egyik módszere a standard modellalapú hibák és a robusztus hibák összehasonlítása annak megállapítására, hogy vannak-e nagy különbségek.
  • 4. feltételezés: A számlálások eloszlása (a modelltől függően) Poisson-eloszlást követ. Ennek egyik következménye, hogy a megfigyelt és a várható számlálásoknak egyenlőnek kell lenniük (a valóságban csak nagyon hasonlóak). Lényegében ez azt jelenti, hogy a modell jól előrejelzi a megfigyelt számokat. Ezt többféleképpen lehet tesztelni, de az egyik módszer az, hogy kiszámítjuk a várható számokat, és ezeket ábrázoljuk a megfigyelt számokkal, hogy lássuk, hasonlóak-e.
  • 5. feltételezés: A modell átlaga és szórása azonos. Ez a 4. feltételezés következménye; hogy Poisson-eloszlás van. Poisson-eloszlás esetén a szórásnak ugyanaz az értéke, mint az átlagnak. Ha ez a feltételezés teljesül, akkor egyenlő szórással rendelkezünk. Gyakran azonban ez nem így van, és az adatok vagy alul- vagy túlszórtak, a túlszórás a gyakoribb probléma. A túldiszperzió értékelésére számos módszer áll rendelkezésre. Az egyik módszer a Pearson-féle szórási statisztika értékelése.

A 3., 4. és 5. feltételezést az SPSS Statistics segítségével ellenőrizheti. Először az #1 és #2 feltételezést kell ellenőrizni, mielőtt a #3, #4 és #5 feltételezésekre térnénk rá. Ne feledje, hogy ha nem megfelelően futtatja le ezekre a feltételezésekre vonatkozó statisztikai teszteket, akkor a Poisson-regresszió futtatása során kapott eredmények nem biztos, hogy érvényesek lesznek.

Amellett, ha az adatai megsértették az 5. feltételezést, ami rendkívül gyakori a Poisson-regresszió végrehajtása során, akkor először azt kell ellenőriznie, hogy van-e “látszólagos Poisson-túlszórás”. A látszólagos Poisson-túlszórás az, amikor nem adtad meg helyesen a modellt, így az adatok túlszórtnak tűnnek. Ezért, ha a Poisson-modellje kezdetben sérti az egyenletes szórás feltételezését, akkor először számos kiigazítást kell végeznie a Poisson-modelljén, hogy ellenőrizze, hogy az valóban túlszórt. Ehhez hat ellenőrzést kell végeznie a modelljén/adatain: (a) A Poisson-modellje tartalmazza az összes fontos prediktort?; b) Az adatai tartalmaznak-e kiugró értékeket?; c) A Poisson-regressziója tartalmazza-e az összes releváns interakciós kifejezést?; d) Szükséges-e valamelyik prediktort transzformálni?; e) A Poisson-modellje több adatot igényel-e és/vagy az adatai túl ritkák-e?; és (f) Vannak olyan hiányzó értékei, amelyek nem véletlenszerűen hiányoznak (MAR)?

Az Eljárás című részben bemutatjuk az SPSS Statistics eljárást a Poisson-regresszió elvégzéséhez, feltételezve, hogy nem sérültek a feltételezések. Először bemutatjuk az útmutatóban használt példát.

SPSS Statistics

Példa & Beállítás az SPSS Statisticsban

Egy kis egyetem kutatási igazgatója azt szeretné felmérni, hogy egy akadémikus tapasztalata és a kutatásra rendelkezésre álló ideje befolyásolja-e az általa készített publikációk számát. Ezért az egyetem 21 akadémikusából álló véletlenszerű mintát kérnek fel a kutatásban való részvételre: 10 tapasztalt akadémikus és 11 újonnan végzett akadémikus. Feljegyzik, hogy az elmúlt 12 hónapban hány órát töltöttek kutatással, és hány szakmailag lektorált publikációt hoztak létre.

Az SPSS Statistics programban e vizsgálati terv felállításához három változót hoztunk létre: (1) no_of_publications, amely az akadémikus által az elmúlt 12 hónapban lektorált folyóiratokban publikált publikációk száma; (2) experience_of_academic, amely azt tükrözi, hogy az akadémikus tapasztalt-e (azaz 10 éve vagy annál régebben dolgozott az akadémiai életben, és ezért a “tapasztalt akadémikus” kategóriába tartozik) vagy nemrég lett akadémikus (azaz, 3 évnél rövidebb ideje, de legalább egy éve dolgozik az akadémiai pályán, és ezért a “friss akadémikus” kategóriába tartozik); és (3) no_of_weekly_hours, amely a kutatómunkára rendelkezésre álló heti órák számát mutatja.

SPSS Statistics

Teszteljárás az SPSS Statistics programban

Az alábbi 13 lépésből megtudhatja, hogyan elemezheti adatait Poisson-regresszió segítségével az SPSS Statistics programban, ha az előző, Feltételezések című részben szereplő öt feltételezés egyike sem sérült. A 13 lépés végén megmutatjuk, hogyan értelmezze a Poisson-regresszió eredményeit.

  1. Kattintson az Elemzésre > Generalized Linear Models > Generalized Linear Models… a főmenüben az alábbiak szerint:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

    Az alábbi Generalized Linear Models párbeszédpanel jelenik meg:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

  2. Az területen válassza ki a Poisson loglineáris modelleket az alábbiak szerint:

    Published with written permission from SPSS Statistics, IBM Corporation.

    Figyelem: Míg a Poisson loglineáris kiválasztása a területen a Poisson-regresszió elvégzéséhez alapértelmezett, addig egyéni Poisson-regresszió futtatását is választhatja, ha a területen kiválasztja az Egyéni lehetőséget, majd a Distribution:, Link function: és -Parameter- opciók segítségével megadja a futtatni kívánt Poisson-modell típusát.

  3. Válassza a lapot. A következő párbeszédpanel jelenik meg:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

  4. A függő változóját, a no_of_publications-t a területen lévő Dependent variable: mezőbe helyezze át a gomb segítségével, az alábbiak szerint:

    Published with written permission from SPSS Statistics, IBM Corporation.

  5. Válassza ki a lapot. A következő párbeszédpanel jelenik meg:

    Published with written permission from SPSS Statistics, IBM Corporation.

  6. A kategorikus független változót, experience_of_academic, a Factors: mezőbe, a folytonos független változót, no_of_weekly_hours, pedig a Covariates: mezőbe helyezze át a gombok segítségével, ahogy az alábbiakban látható:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

    1. megjegyzés: Ha vannak ordinális független változói, el kell döntenie, hogy ezeket kategorikusnak kell-e kezelni, és a Factors: mezőbe kell-e írni, vagy folytonosnak kell-e kezelni, és a Covariates: mezőbe kell-e írni. Ezek nem adhatók be a Poisson-regresszióba ordinális változóként.

    2. megjegyzés: Míg jellemzően folytonos független változókat adunk meg a Covariates: mezőbe, lehetőség van ordinális független változók megadására is. Ha azonban ezt választja, az ordinális független változót folytonosnak fogja kezelni.

    3. megjegyzés: Ha a gombra kattint, a következő párbeszédpanel jelenik meg:

    A -Category Order for Factors- területen választhat az Ascending, Descending és Use data order opciók közül. Ezek azért hasznosak, mert az SPSS Statistics a kategorikus változókat automatikusan dummy-változókká alakítja. Hacsak nem ismeri a dummy-változókat, ez kissé bonyolulttá teheti a Poisson-regresszió kimenetének értelmezését a kategorikus változók egyes csoportjaira vonatkozóan. Ezért a -Category Order for Factors- terület beállításainak módosítása megkönnyítheti a kimenet értelmezését.

  7. Válassza ki a lapot. A következő párbeszédpanel jelenik meg:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

  8. Megtartja az alapértelmezett értéket a -Build Term(s)- területen, és a Factors and Covariates: mezőből a kategorikus és folytonos független változókat, experience_of_academic és no_of_weekly_hours, a gomb segítségével átviszi a Model: mezőbe, az alábbiak szerint:

    Published with written permission from SPSS Statistics, IBM Corporation.

    1. megjegyzés: A párbeszédpanelben építi fel a Poisson-modellt. Különösen azt határozza meg, hogy milyen főhatásokkal rendelkezik (a opció), valamint azt, hogy a független változói között várható-e kölcsönhatás (a opció). Ha azt gyanítja, hogy a független változói között kölcsönhatások vannak, akkor ezek bevonása a modelljébe nemcsak a modell előrejelzésének javítása érdekében fontos, hanem a túldiszperzió problémáinak elkerülése érdekében is, amint azt korábban a Feltételezések szakaszban kiemeltük.
    Míg egy nagyon egyszerű, egyetlen főhatást tartalmazó modellre adunk példát (a kategorikus és a folytonos független változók, a tapasztalat_az_akadémiai és a no_of_weekly_hours között), a , , segítségével könnyen megadhat összetettebb modelleket is. és opciókat a -Build Term(s)- területen attól függően, hogy milyen típusú főhatásokat és kölcsönhatásokat tartalmaz a modellje.

    Megjegyzés 2: Beágyazott kifejezéseket is beépíthet a modelljébe, ha ezeket a -Build Nested Term- terület Term: mezőjébe adja. Ebben a modellben nincsenek egymásba ágyazott hatások, de számos olyan forgatókönyv van, amikor lehetnek egymásba ágyazott kifejezések a modelljében.

  9. Válassza ki a lapot. A következő párbeszédpanel jelenik meg:

    Ez az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

  10. Maradjon az alapértelmezett beállítások kiválasztva.

    Figyelem: A -Paraméterbecslés- területen belül számos különböző opciót választhat, beleértve a különböző: (a) skálaparaméter-módszert (azaz vagy helyett a Scale Parameter Method: mezőben), ami a túldiszperzió problémáinak kezelésére jöhet szóba; és (b) kovariancia-mátrixot (azaz Robust estimator helyett Model-based estimator a -Covariance Matrix- területen), ami egy másik lehetséges opciót jelent (többek között) a túldiszperzió problémáinak kezelésére.
    Az -Iterációk- területen is számos specifikációt tehet a Poisson-modell nem-konvergencia problémáinak kezelése érdekében.

  11. Válassza ki a lapot. A következő párbeszédpanel jelenik meg:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

  12. A területen válassza az alábbiakban látható Include exponential parameter estimates (exponenciális paraméterbecslések felvétele) lehetőséget:

    Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

    1. megjegyzés: A területen választhat a Wald- és a Likelihood-arány között olyan tényezők alapján, mint a mintanagyság és annak a statisztikai szignifikanciateszt pontosságára gyakorolt hatása.
    A területen a Lagrange-szorzó teszt is hasznos lehet annak megállapításához, hogy a Poisson-modell megfelelő-e az adataihoz (bár ez nem futtatható a Poisson-regressziós eljárással).

    Megjegyzés 2: A és lapokon egyéb lehetőségek széles skáláját is kiválaszthatja. Ezek között vannak olyan beállítások, amelyek fontosak a kategorikus változói csoportjai közötti különbségek vizsgálatakor, valamint a Poisson-regresszió feltételezéseinek tesztelésekor, amint azt a Feltételezések című részben korábban tárgyaltuk.

  13. Kattintson a gombra. Ez létrehozza a kimenetet.

SPSS Statistics

Interpreting and Reporting the Output of Poisson Regression Analysis

Az SPSS Statistics elég sok kimeneti táblázatot generál a Poisson-regressziós elemzéshez. Ebben a szakaszban a Poisson-regressziós eljárás eredményeinek megértéséhez szükséges nyolc fő táblázatot mutatjuk be, feltételezve, hogy nem sérültek a feltételezések.

Modell és változó információk

A kimenet első táblázata a Modellinformációs táblázat (az alábbiakban látható). Ez megerősíti, hogy a függő változó a “Publikációk száma”, a valószínűségi eloszlás a “Poisson”, a kapcsolatfüggvény pedig a természetes logaritmus (azaz a “Log”). Ha Poisson-regressziót futtat a saját adatain, a függő változó neve más lesz, de a valószínűségi eloszlás és a kapcsolófüggvény ugyanaz.

Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

A második táblázat, Case Processing Summary, azt mutatja, hogy hány eset (pl., alanyok) kerültek be az elemzésbe (a “Beleértve” sor) és hány nem került be (a “Kizárva” sor), valamint mindkettő százalékos aránya. A “Kizárt” sorra úgy gondolhat, hogy az egy vagy több hiányzó értékkel rendelkező eseteket (pl. alanyokat) jelzi. Amint az alábbiakban látható, ebben az elemzésben 21 alany szerepelt úgy, hogy egyetlen alany sem volt kizárva (azaz nem voltak hiányzó értékek).

Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

A kategorikus változók információi táblázat kiemeli az elemzésben szereplő minden egyes független kategorikus változó egyes csoportjaiban szereplő esetek (pl. alanyok) számát és százalékos arányát. Ebben az elemzésben csak egy kategorikus független változó (más néven “faktor”) van, amely a experience_of_academic volt. Láthatja, hogy a csoportok száma meglehetősen kiegyensúlyozott a két csoport között (pl. 10 versus 11). Az erősen kiegyensúlyozatlan csoportméretek problémákat okozhatnak a modellillesztéssel, de láthatjuk, hogy itt nincs probléma.

Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

A Continuous Variable Information (Folyamatos változó információi) táblázat kezdetlegesen ellenőrizheti az adatokat az esetleges problémák szempontjából, de kevésbé hasznos, mint más leíró statisztikák, amelyeket a Poisson-regresszió futtatása előtt külön lefuttathat. A legtöbb, amit ebből a táblázatból kihozhat, hogy képet kapjon arról, hogy van-e esetleg túldiszperzió az elemzésben (azaz a Poisson-regresszió 5. feltételezése). Ezt úgy teheti meg, hogy megvizsgálja a variancia (az “Std. Deviation” oszlop négyzete) és az átlag (a “Mean” oszlop) arányát a függő változó esetében. Az alábbiakban láthatja ezeket az ábrákat:

Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

Az átlag 2,29, a szórás pedig 2,81 (1,677582), ami a 2,81 ÷ 2,29 = 1,23 arányt jelenti. A Poisson-eloszlás 1 arányt feltételez (azaz az átlag és a szórás egyenlő). Ezért láthatjuk, hogy mielőtt bármilyen magyarázó változót hozzáadnánk, van egy kis túlszórás. Ellenőriznünk kell azonban ezt a feltételezést, amikor az összes független változót hozzáadtuk a Poisson-regresszióhoz. Ezt a következő szakaszban tárgyaljuk.

A modell illeszkedésének meghatározása

A Goodness of Fit (illeszkedés jósága) táblázat számos olyan mérőszámot tartalmaz, amelyek segítségével értékelhetjük, hogy a modell mennyire illeszkedik. Mi azonban a “Pearson Chi-négyzet” sor “Value/df” oszlopában szereplő értékre fogunk koncentrálni, amely ebben a példában 1,108, ahogy az alábbiakban látható:

Ez az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

Az 1 érték egyenlő szórást jelez, míg az 1-nél nagyobb értékek túlságosan nagy szórást, az 1 alatti értékek pedig alul szórást jeleznek. Az egyenletes szórás feltételezés megsértésének leggyakoribb típusa a túldiszperzió. Ebben a példában egy ilyen kis mintaméret mellett az 1,108-as érték valószínűleg nem jelenti e feltételezés súlyos megsértését.

Az Omnibus teszt táblázat valahol e szakasz és a következő között helyezkedik el. Ez egy valószínűségi arányteszt arra vonatkozóan, hogy az összes független változó együttesen javítja-e a modellt a csak metszéspontos modellhez képest (azaz független változók hozzáadása nélkül). Mivel példamodellünkben az összes független változó szerepel, p-értékünk 0,006 (azaz p = 0,006), ami statisztikailag szignifikáns teljes modellt jelez, amint az alább a “Sig.” oszlopban látható:

Published with written permission from SPSS Statistics, IBM Corporation.

Most, hogy tudjuk, hogy az összes független változó hozzáadása statisztikailag szignifikáns modellt eredményez, szeretnénk tudni, hogy mely konkrét független változók statisztikailag szignifikánsak. Ezt a következő szakaszban tárgyaljuk.

Modellhatások és a független változók statisztikai szignifikanciája

A modellhatások tesztjei táblázatban (az alábbiakban látható módon) a “Sig.” oszlopban az egyes független változók statisztikai szignifikanciája látható:

Az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

A modell interceptje általában nem érdekes. Láthatjuk azonban, hogy az akadémikus tapasztalata statisztikailag nem szignifikáns (p = .644), de a heti munkaórák száma statisztikailag szignifikáns (p = .030). Ez a táblázat leginkább kategorikus független változók esetében hasznos, mert ez az egyetlen olyan táblázat, amely a kategorikus változó teljes hatását figyelembe veszi, ellentétben a Parameter Estimates táblával, mint az alábbiakban látható:

Ez az SPSS Statistics, IBM Corporation írásos engedélyével jelent meg.

Ez a táblázat a Poisson-regresszió együtthatóbecsléseit (a “B” oszlop) és az együtthatók exponenciált értékeit (az “Exp(B)” oszlop) is tartalmazza. Általában az utóbbiak az informatívabbak. Ezek az exponenciált értékek többféleképpen is értelmezhetők, és ebben az útmutatóban az egyik módot mutatjuk be. Vegyük például a heti munkaórák számát (azaz a “no_of_weekly_hours” sort). Az exponenciált érték 1,044. Ez azt jelenti, hogy a publikációk száma (azaz a függő változó számlálása) 1,044-szer nagyobb lesz minden egyes plusz heti ledolgozott óra után. Másképpen fogalmazva: a publikációk száma 4,4%-kal nő minden egyes heti többlet munkaóra után. Hasonló értelmezés adható a kategorikus változóra is.

Az egészet összerakva

A heti munkaórák számának eredményeit a következőképpen írhatná le:

  • Általános

A Poisson-regressziót futtattuk le, hogy megjósoljuk, hány publikációt jelentet meg egy akadémikus az elmúlt 12 hónapban az akadémikus tapasztalata és a kutatással töltött heti munkaórák száma alapján. Minden egyes heti többlet kutatási órára 1,044-szer (95% CI, 1,004-1,085) több publikáció jelent meg, ami statisztikailag szignifikáns eredmény, p = .030.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.