Poisson Regressie Analyse met SPSS Statistieken

Inleiding

Poisson regressie wordt gebruikt om een afhankelijke variabele te voorspellen die bestaat uit “telgegevens” gegeven één of meer onafhankelijke variabelen. De variabele die we willen voorspellen wordt de afhankelijke variabele genoemd (of soms de respons-, uitkomst-, doel- of criteriumvariabele). De variabelen die wij gebruiken om de waarde van de afhankelijke variabele te voorspellen, worden de onafhankelijke variabelen genoemd (of soms de voorspellende, verklarende of regressorvariabelen). Enkele voorbeelden waarbij Poisson regressie zou kunnen worden gebruikt, worden hieronder beschreven:

  • Voorbeeld #1: U zou Poisson regressie kunnen gebruiken om het aantal door scholen in Washington in de Verenigde Staten geschorste leerlingen te onderzoeken op basis van voorspellers zoals geslacht (meisjes en jongens), ras (blank, zwart, Hispanic, Aziatisch/Pacifiek Eilandbewoner en Amerikaans-Indiaans/Alaska Inheems), taal (Engels is hun eerste taal, Engels is niet hun eerste taal) en handicap status (gehandicapt en niet-gehandicapt). Hier is het “aantal schorsingen” de afhankelijke variabele, terwijl “geslacht”, “ras”, “taal” en “invaliditeitsstatus” allemaal nominale onafhankelijke variabelen zijn.
  • Voorbeeld 2: U zou Poisson-regressie kunnen gebruiken om te onderzoeken hoe vaak mensen in Australië in een periode van vijf jaar in gebreke blijven bij de aflossing van hun creditcard, op basis van voorspellers zoals werkstatus (werkend, werkloos), jaarsalaris (in Australische dollars), leeftijd (in jaren), geslacht (man en vrouw) en werkloosheidsniveaus in het land (% werklozen). Hier is het “aantal wanbetalingen bij kredietkaartbetalingen” de afhankelijke variabele, terwijl “beroepsstatus” en “geslacht” nominale onafhankelijke variabelen zijn, en “jaarsalaris”, “leeftijd” en “werkloosheidsniveau in het land” continue onafhankelijke variabelen zijn.
  • Voorbeeld #3: U zou Poisson-regressie kunnen gebruiken om het aantal mensen te onderzoeken dat voor u staat in de rij op de afdeling Spoedeisende Hulp (A&E) van een ziekenhuis op basis van voorspellers zoals de wijze van aankomst op de A&E (ambulance of zelf inchecken), de beoordeelde ernst van het letsel tijdens de triage (licht, matig, ernstig), het tijdstip van de dag en de dag van de week. Hier is het “aantal mensen voor u in de rij” de afhankelijke variabele, terwijl “wijze van aankomst” een nominale onafhankelijke variabele is, “beoordeelde ernst van het letsel” een ordinale onafhankelijke variabele is, en “tijdstip” en “dag van de week” continue onafhankelijke variabelen zijn.
  • Voorbeeld 4: U zou Poisson-regressie kunnen gebruiken om het aantal studenten te onderzoeken dat een eersteklas cijfer behaalt in een MBA-programma op basis van voorspellers zoals de soorten keuzevakken die zij kozen (hoofdzakelijk numeriek, hoofdzakelijk kwalitatief, een mengeling van numeriek en kwalitatief) en hun GPA bij binnenkomst in het programma. Hier is “aantal eersteklassers” de afhankelijke variabele, terwijl “keuzevakken” een nominale onafhankelijke variabele is en “GPA” een continue onafhankelijke variabele.

Wanneer u een Poisson-regressie hebt uitgevoerd, kunt u bepalen welke van uw onafhankelijke variabelen (als die er zijn) een statistisch significant effect hebben op uw afhankelijke variabele. Voor categorische onafhankelijke variabelen zal je de procentuele toename of afname kunnen bepalen in het aantal doden van de ene groep (bv. kinderen die in achtbanen rijden) tegenover een andere groep (bv. volwassenen die in achtbanen rijden). Voor continue onafhankelijke variabelen zult u in staat zijn om te interpreteren hoe een enkele eenheidstoename of -afname in die variabele samenhangt met een procentuele toename of afname in de tellingen van uw afhankelijke variabele (bijv. een afname van $ 1.000 in salaris – de onafhankelijke variabele – op de procentuele verandering in het aantal keren dat mensen in Australië in gebreke blijven bij de aflossing van hun creditcard – de afhankelijke variabele).

Deze “snelstartgids” laat u zien hoe u Poisson-regressie kunt uitvoeren met behulp van SPSS Statistics, evenals hoe u de resultaten van deze test kunt interpreteren en rapporteren. Voordat we u echter met deze procedure laten kennismaken, moet u de verschillende veronderstellingen begrijpen waaraan uw gegevens moeten voldoen opdat Poisson regressie u een geldig resultaat zou geven. We bespreken deze aannames hierna.

Note: We hebben momenteel geen premium versie van deze gids in het abonnementsgedeelte van onze website.

SPSS Statistics

Aannames

Wanneer u ervoor kiest om uw gegevens met Poisson regressie te analyseren, is een deel van het proces het controleren of de gegevens die u wilt analyseren ook werkelijk met Poisson regressie kunnen worden geanalyseerd. Dit is nodig omdat Poisson regressie alleen kan worden gebruikt als de gegevens voldoen aan de vijf veronderstellingen die voor Poisson regressie nodig zijn om een geldig resultaat op te leveren. In de praktijk zal het controleren van deze vijf veronderstellingen het grootste deel van je tijd in beslag nemen wanneer je Poisson regressie uitvoert. Het is echter essentieel dat je dit doet omdat het niet ongewoon is dat gegevens één of meer van deze veronderstellingen schenden (d.w.z. niet voldoen). Maar zelfs wanneer uw gegevens niet voldoen aan sommige van deze veronderstellingen, is er vaak een oplossing om dit te verhelpen. Laten we eerst eens kijken naar deze vijf aannames:

  • Aanname #1: Uw afhankelijke variabele bestaat uit telgegevens. Telgegevens verschillen van de gegevens die worden gemeten in andere bekende soorten regressie (bijv. lineaire regressie en meervoudige regressie vereisen afhankelijke variabelen die worden gemeten op een “continue” schaal, binomiale logistische regressie vereist een afhankelijke variabele gemeten op een “dichotome” schaal, ordinale regressie vereist een afhankelijke variabele gemeten op een “ordinale” schaal, en multinomiale logistische regressie vereist een afhankelijke variabele gemeten op een “nominale” schaal). Daarentegen vereisen telvariabelen gehele getallen die nul of groter moeten zijn. In eenvoudige bewoordingen: een “geheel getal” is een “geheel getal” (bv. 0, 1, 5, 8, 354, 888, 23400, enz.). En aangezien telgegevens “positief” moeten zijn (d.w.z. uit “niet-negatieve” gehele getallen moeten bestaan), kunnen ze niet uit “min”-waarden bestaan (waarden als -1, -5, -8, -354, -888 en -23400 zouden bijvoorbeeld niet als telgegevens worden beschouwd). Bovendien wordt soms voorgesteld Poisson regressie alleen uit te voeren wanneer het gemiddelde aantal tellingen een kleine waarde is (bv. minder dan 10). Wanneer er grote aantallen tellingen zijn, kan een ander type regressie geschikter zijn (b.v. meervoudige regressie, gamma regressie, enz.).
    Voorbeelden van telvariabelen zijn het aantal vluchten met meer dan drie uur vertraging op Europese luchthavens, het aantal leerlingen dat door scholen in Washington in de Verenigde Staten wordt geschorst, het aantal keren dat mensen in Australië in een periode van vijf jaar in gebreke blijven met de aflossing van hun creditcard, het aantal mensen voor u in de rij op de afdeling Ongevallen & Spoedeisende Hulp (A&E) van een ziekenhuis, het aantal studenten dat een eersteklas cijfer behaalt (gewoonlijk minder dan 5) in een MBA-programma, en het aantal mensen dat in de Verenigde Staten omkomt bij ongelukken in achtbanen.
  • Aanname #2: Je hebt een of meer onafhankelijke variabelen, die gemeten kunnen worden op een continue, ordinale of nominale/dichotome schaal. Ordinale en nominale/dichotome variabelen kunnen grofweg worden geclassificeerd als categorische variabelen.
    Voorbeelden van continue variabelen zijn revisietijd (gemeten in uren), intelligentie (gemeten met behulp van IQ-score), examenprestaties (gemeten van 0 tot 100) en gewicht (gemeten in kg). Voorbeelden van ordinale variabelen zijn Likert-items (bv. een 7-puntsschaal van “zeer mee eens” tot “zeer mee oneens”), naast andere manieren om categorieën te rangschikken (bv. een 3-puntsschaal die aangeeft hoeveel een klant van een product houdt, variërend van “niet erg mee eens” tot “ja, heel erg mee eens”). Voorbeelden van nominale variabelen zijn geslacht (bv. twee groepen – man en vrouw – dus ook bekend als een dichotome variabele), etniciteit (bv. drie groepen: Kaukasisch, Afro-Amerikaans en Spaans) en beroep (bv. vijf groepen: chirurg, arts, verpleegkundige, tandarts, therapeut). Onthoud dat ordinale en nominale/dichotome variabelen grofweg kunnen worden geclassificeerd als categorische variabelen. U kunt meer te weten komen over variabelen in ons artikel: Soorten Variabelen.
  • Veronderstelling #3: Je moet onafhankelijkheid van waarnemingen hebben. Dit betekent dat elke waarneming onafhankelijk is van de andere waarnemingen; dat wil zeggen dat een waarneming geen informatie kan verschaffen over een andere waarneming. Dit is een zeer belangrijke veronderstelling. Een gebrek aan onafhankelijke waarnemingen is meestal een kwestie van studieopzet. Een methode om te testen op de mogelijkheid van onafhankelijkheid van waarnemingen is de vergelijking van op het model gebaseerde standaardfouten met robuuste fouten om te bepalen of er grote verschillen zijn.
  • Veronderstelling #4: De verdeling van tellingen (afhankelijk van het model) volgt een Poisson-verdeling. Een gevolg hiervan is dat de waargenomen en verwachte tellingen gelijk moeten zijn (in werkelijkheid slechts zeer vergelijkbaar). In wezen betekent dit dat het model de waargenomen tellingen goed voorspelt. Dit kan op verschillende manieren worden getest, maar één methode is om de verwachte tellingen te berekenen en deze uit te zetten tegen de waargenomen tellingen om te zien of ze gelijk zijn.
  • Veronderstelling #5: Het gemiddelde en de variantie van het model zijn identiek. Dit is een gevolg van veronderstelling #4; dat er sprake is van een Poisson-verdeling. Bij een Poisson-verdeling heeft de variantie dezelfde waarde als het gemiddelde. Als aan deze aanname wordt voldaan, is er sprake van equidispersie. Vaak is dit echter niet het geval en zijn de gegevens onder- of oververspreid, waarbij overdispersie het meest voorkomende probleem is. Er zijn verschillende methoden die u kunt gebruiken om overdispersie te beoordelen. Eén methode is het bepalen van de Pearson-dispersiestatistiek.

U kunt aannames #3, #4 en #5 controleren met SPSS Statistics. Veronderstellingen #1 en #2 moeten eerst gecontroleerd worden, voordat we verder gaan met veronderstellingen #3, #4, en #5. Vergeet niet dat als je de statistische tests op deze aannames niet correct uitvoert, de resultaten die je krijgt bij het uitvoeren van Poisson regressie mogelijk niet geldig zijn.

Ook als je gegevens in strijd zijn met aanname #5, wat heel gebruikelijk is bij het uitvoeren van Poisson regressie, moet je eerst controleren of je “schijnbare Poisson overdispersie” hebt. Schijnbare Poisson overdispersie is wanneer je het model niet correct hebt gespecificeerd zodat de gegevens overdispers lijken. Daarom moet u, als uw Poisson-model aanvankelijk de aanname van equidispersie schendt, eerst een aantal aanpassingen in uw Poisson-model aanbrengen om na te gaan of het werkelijk overdispers is. Dit vereist dat u zes controles van uw model/gegevens uitvoert: (a) Bevat je Poisson model alle belangrijke voorspellers?; (b) Bevatten je gegevens uitschieters?; (c) Bevat je Poisson regressie alle relevante interactietermen?; (d) Moeten sommige van je voorspellers getransformeerd worden?; (e) Heeft je Poisson model meer gegevens nodig en/of zijn je gegevens te schaars?en (f) hebt u ontbrekende waarden die niet willekeurig ontbreken (MAR)?

In de sectie, Procedure, illustreren we de SPSS Statistics procedure om een Poisson regressie uit te voeren, ervan uitgaande dat er geen veronderstellingen zijn geschonden. Eerst introduceren we het voorbeeld dat in deze handleiding wordt gebruikt.

SPSS Statistics

Example & Setup in SPSS Statistics

De directeur Onderzoek van een kleine universiteit wil nagaan of de ervaring van een academicus en de tijd die hij beschikbaar heeft voor het doen van onderzoek van invloed zijn op het aantal publicaties dat hij produceert. Daarom wordt een willekeurige steekproef van 21 academici van de universiteit gevraagd deel te nemen aan het onderzoek: 10 zijn ervaren academici en 11 zijn recente academici. Het aantal uren dat zij in de laatste 12 maanden aan onderzoek hebben besteed en het aantal peer-reviewed publicaties dat zij hebben gegenereerd, worden geregistreerd.

Om deze studieopzet in SPSS Statistics op te zetten, hebben wij drie variabelen gecreëerd: (1) no_of_publications, dat is het aantal publicaties dat de academicus in de afgelopen 12 maanden in peer-reviewed tijdschriften heeft gepubliceerd; (2) experience_of_academic, dat weergeeft of de academicus ervaren is (d.w.z. 10 jaar of langer in de academische wereld heeft gewerkt, en daarom als een “ervaren academicus” wordt geclassificeerd) of onlangs academicus is geworden (d.w.z., minder dan 3 jaar, maar ten minste 1 jaar in de academische wereld heeft gewerkt, en daarom wordt geclassificeerd als een “recente academicus”); en (3) no_of_weekly_hours, het aantal uren dat een academicus elke week beschikbaar heeft om aan onderzoek te werken.

SPSS Statistics

Testprocedure in SPSS Statistics

De onderstaande 13 stappen laten zien hoe u uw gegevens kunt analyseren met Poisson-regressie in SPSS Statistics wanneer geen van de vijf aannames in de vorige sectie, Assumptions, is geschonden. Aan het eind van deze 13 stappen laten we u zien hoe u de resultaten van uw Poisson regressie kunt interpreteren.

  1. Klik op Analyseren > Gegeneraliseerde lineaire modellen > Gegeneraliseerde lineaire modellen… in het hoofdmenu, zoals hieronder weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

    U krijgt nu het dialoogvenster Generalized Linear Models te zien:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  2. Selecteer Poisson loglinear in het -gebied, zoals hieronder weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

    Note: Hoewel het standaard is om Poisson loglinear te selecteren in het -gebied om een Poisson-regressie uit te voeren, kunt u er ook voor kiezen om een aangepaste Poisson-regressie uit te voeren door Custom te selecteren in het -gebied en vervolgens het type Poisson-model op te geven dat u wilt uitvoeren met behulp van de opties Distribution:, Link function: en -Parameter.

  3. Selecteer het -tabblad. U krijgt het volgende dialoogvenster te zien:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  4. Verplaats uw afhankelijke variabele, no_of_publications, in het vak Dependent variable: in het gebied met behulp van de knop , zoals hieronder getoond:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  5. Selecteer het tabblad . Het volgende dialoogvenster wordt weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  6. Verplaats de categorische onafhankelijke variabele, experience_of_academic, naar het vak Factors: en de continue onafhankelijke variabele, no_of_weekly_hours, naar het vak Covariates: met behulp van de knoppen, zoals hieronder is weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

    Opmerking 1: Als u ordinale onafhankelijke variabelen hebt, moet u beslissen of deze als categorisch moeten worden behandeld en in het vak Factors: moeten worden ingevoerd, of als continu moeten worden behandeld en in het vak Covariates: moeten worden ingevoerd. Zij kunnen niet als ordinale variabelen in een Poisson regressie worden ingevoerd.

    Opmerking 2: Hoewel het gebruikelijk is om continue onafhankelijke variabelen in te voeren in het vak Covariates:, is het mogelijk om in plaats daarvan ordinale onafhankelijke variabelen in te voeren. Als u hiervoor kiest, wordt uw ordinale onafhankelijke variabele echter als continu behandeld.

    Note 3: Als u op de knop klikt, verschijnt het volgende dialoogvenster:

    In het gebied -Categorievolgorde voor factoren- kunt u kiezen uit de opties Oplopende, Aflopende en Gegevensvolgorde gebruiken. Deze zijn nuttig omdat SPSS Statistics uw categorische variabelen automatisch in dummyvariabelen verandert. Tenzij u vertrouwd bent met dummy-variabelen, kan dit het interpreteren van de uitvoer van een Poisson regressie voor elk van de groepen van uw categorische variabelen een beetje lastig maken. Daarom kunnen wijzigingen in de opties in het gebied -Categorievolgorde voor factoren- het interpreteren van uw uitvoer vergemakkelijken.

  7. Kies het tabblad . U krijgt het volgende dialoogvenster te zien:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  8. Houd de standaardwaarde in het gebied -Build Term(s)- en verplaats de categorische en continue onafhankelijke variabelen, ervaring_van_academisch en geen_van_wekelijkse_uren, van het vak Factoren en covariaten: naar het vak Model: met behulp van de knop , zoals hieronder wordt weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

    Note 1: Het is in het dialoogvenster dat u uw Poisson-model opbouwt. U bepaalt met name welke hoofdeffecten u hebt (de -optie), en of u verwacht dat er interacties zijn tussen uw onafhankelijke variabelen (de -optie). Als u vermoedt dat er interacties zijn tussen uw onafhankelijke variabelen, is het belangrijk deze in uw model op te nemen, niet alleen om de voorspelling van uw model te verbeteren, maar ook om problemen met overdispersie te voorkomen, zoals eerder in het gedeelte Veronderstellingen is benadrukt.
    Hoewel wij een voorbeeld geven van een zeer eenvoudig model met slechts één hoofdeffect (tussen de categorische en continue onafhankelijke variabelen, ervaring_van_academisch en geen_van_wekelijkse_uren), kunt u gemakkelijk complexere modellen invoeren door gebruik te maken van de , , . en opties in het -Build Term(s)-gebied, afhankelijk van het type hoofdeffecten en interacties dat u in uw model hebt.

    Note 2: U kunt ook geneste termen in uw model inbouwen door deze toe te voegen in het vak Term: in het -Build Nested Term-gebied. Wij hebben geen geneste effecten in dit model, maar er zijn veel scenario’s waarin u geneste termen in uw model zou kunnen hebben.

  9. Kies het tabblad . U krijgt het volgende dialoogvenster te zien:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  10. Houd de standaardopties geselecteerd.

    Note: Er zijn een aantal verschillende opties die u kunt selecteren binnen het gebied -Parameter Estimation-, waaronder de mogelijkheid om een andere: (a) schaalparametermethode (d.w.z. of in plaats van in het vak Scale Parameter Method:), die kan worden overwogen om problemen van overdispersie aan te pakken; en (b) covariantiematrix (d.w.z. Robust estimator in plaats van Model-based estimator in het -Covariantiematrix- gebied), die een andere potentiële optie biedt (onder andere) om problemen van overdispersie aan te pakken.
    Er zijn ook een aantal specificaties die u kunt geven in het gebied -Iteraties- om problemen met niet-convergentie in uw Poisson-model op te lossen.

  11. Selecteer het tabblad . U krijgt het volgende dialoogvenster te zien:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

  12. Selecteer Include exponential parameter estimates in het -gebied, zoals hieronder weergegeven:

    Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

    Note 1: In het -gebied kunt u kiezen tussen de Wald- en de Likelihood-ratio op basis van factoren zoals steekproefgrootte en de implicaties die dit kan hebben voor de nauwkeurigheid van statistische significantietoetsen.
    In het -gebied kan de Lagrange-multiplicatortest ook nuttig zijn om te bepalen of het Poisson-model geschikt is voor uw gegevens (hoewel dit niet kan worden uitgevoerd met behulp van de Poisson-regressieprocedure).

    Noot 2: U kunt ook een groot aantal andere opties selecteren op de en -tabbladen. Hiertoe behoren opties die van belang zijn bij het onderzoeken van verschillen tussen de groepen van uw categorische variabelen en bij het testen van de veronderstellingen van Poisson regressie, zoals eerder besproken in het gedeelte Veronderstellingen.

  13. Klik op de knop . Hiermee wordt de uitvoer gegenereerd.

SPSS Statistics

Interpretatie en rapportage van de uitvoer van een Poisson Regressie Analyse

SPSS Statistics genereert een groot aantal tabellen met uitvoer voor een Poisson regressie analyse. In deze sectie tonen we u de acht belangrijkste tabellen die nodig zijn om de resultaten van de Poisson regressie procedure te begrijpen, ervan uitgaande dat er geen aannames zijn geschonden.

Model en variabele informatie

De eerste tabel in de uitvoer is de Model Informatie tabel (zoals hieronder getoond). Hieruit blijkt dat de afhankelijke variabele het “Aantal publicaties” is, de kansverdeling “Poisson” en de koppelingsfunctie de natuurlijke logaritme (d.w.z. “Log”). Als u een Poisson-regressie uitvoert op uw eigen gegevens, zal de naam van de afhankelijke variabele anders zijn, maar de kansverdeling en de koppelingsfunctie zullen dezelfde zijn.

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

De tweede tabel, Case Processing Summary, laat u zien hoeveel gevallen (bijv, onderwerpen) werden opgenomen in uw analyse (de rij “Included”) en hoeveel er niet werden opgenomen (de rij “Excluded”), evenals het percentage van beide. U kunt de rij “Exclusluded” zien als een aanduiding van gevallen (bijv. proefpersonen) met een of meer ontbrekende waarden. Zoals u hieronder kunt zien, waren er 21 proefpersonen in deze analyse zonder uitgesloten proefpersonen (d.w.z. zonder ontbrekende waarden).

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

De tabel met informatie over categorische variabelen geeft het aantal en het percentage gevallen (bijv. proefpersonen) in elke groep van elke onafhankelijke categorische variabele in uw analyse weer. In deze analyse is er slechts één categorische onafhankelijke variabele (ook bekend als een “factor”), namelijk ervaring_van_academisch. U kunt zien dat de groepen tamelijk evenwichtig in aantal zijn (d.w.z. 10 tegen 11). Zeer onevenwichtige groepsgroottes kunnen problemen veroorzaken met de fit van het model, maar we zien dat er hier geen probleem is.

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

De tabel Continuous Variable Information kan een rudimentaire controle van de gegevens op eventuele problemen geven, maar is minder nuttig dan andere beschrijvende statistieken die u afzonderlijk kunt uitvoeren voordat u de Poisson-regressie uitvoert. Het beste wat u uit deze tabel kunt halen, is inzicht te krijgen in de vraag of er misschien overdispersie in uw analyse zit (d.w.z. Assumptie #5 van Poisson regressie). U kunt dit doen door te kijken naar de verhouding van de variantie (het kwadraat van de kolom “Std. deviatie”) tot het gemiddelde (de kolom “Mean”) voor de afhankelijke variabele. U ziet deze cijfers hieronder:

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

Het gemiddelde is 2,29 en de variantie is 2,81 (1,677582), wat een verhouding is van 2,81 ÷ 2,29 = 1,23. Een Poisson-verdeling gaat uit van een verhouding van 1 (d.w.z. dat het gemiddelde en de variantie gelijk zijn). Daarom zien we dat er een kleine mate van overdispersie is voordat we enige verklarende variabelen toevoegen. Wij moeten deze veronderstelling echter controleren wanneer alle onafhankelijke variabelen aan de Poisson regressie zijn toegevoegd. Dit wordt in de volgende paragraaf besproken.

Bepalen hoe goed het model past

De Goodness of Fit-tabel bevat vele maatstaven die kunnen worden gebruikt om te beoordelen hoe goed het model past. Wij zullen ons echter concentreren op de waarde in de kolom “Waarde/df” voor de rij “Pearson Chi-Square”, die in dit voorbeeld 1,108 is, zoals hieronder wordt getoond:

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

Een waarde van 1 wijst op equidispersie, terwijl waarden groter dan 1 wijzen op overdispersie en waarden kleiner dan 1 op onderdispersie. De meest voorkomende schending van de aanname van equidispersie is overdispersie. Met zo’n kleine steekproefomvang in dit voorbeeld is een waarde van 1,108 waarschijnlijk geen ernstige schending van deze veronderstelling.

De tabel van de Omnibus Test past ergens tussen dit deel en het volgende. Het is een waarschijnlijkheidsratio-toets om na te gaan of alle onafhankelijke variabelen tezamen het model verbeteren ten opzichte van het model met alleen een intercept (d.w.z. zonder toevoeging van onafhankelijke variabelen). Met alle onafhankelijke variabelen in ons voorbeeldmodel hebben we een p-waarde van .006 (d.w.z. p = .006), wat wijst op een statistisch significant totaalmodel, zoals hieronder weergegeven in de kolom “Sig.”:

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

Nu u weet dat de toevoeging van alle onafhankelijke variabelen een statistisch significant model genereert, zult u willen weten welke specifieke onafhankelijke variabelen statistisch significant zijn. Dit wordt in de volgende paragraaf besproken.

Modeleffecten en statistische significantie van de onafhankelijke variabelen

De tabel Tests of Model Effects (zoals hieronder weergegeven) geeft de statistische significantie van elk van de onafhankelijke variabelen weer in de kolom “Sig.”:

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

Er is gewoonlijk geen belangstelling voor de modelintercept. We kunnen echter zien dat de ervaring van de academicus niet statistisch significant was (p = .644), maar het aantal gewerkte uren per week was wel statistisch significant (p = .030). Deze tabel is vooral nuttig voor categorische onafhankelijke variabelen, omdat het de enige tabel is die het totale effect van een categorische variabele in aanmerking neemt, in tegenstelling tot de tabel Parameter Estimates, zoals hieronder te zien is:

Gepubliceerd met schriftelijke toestemming van SPSS Statistics, IBM Corporation.

Deze tabel geeft zowel de coëfficiëntschattingen (de kolom “B”) van de Poisson-regressie als de geëxonenteerde waarden van de coëfficiënten (de kolom “Exp(B)”). Het zijn meestal de laatste die informatiever zijn. Deze geëxponeerde waarden kunnen op meer dan één manier worden geïnterpreteerd en wij zullen u in deze gids één manier tonen. Neem bijvoorbeeld het aantal wekelijks gewerkte uren (d.w.z. de rij “geen_van_wekelijkse_uren”). De geëxponeerde waarde is 1,044. Dit betekent dat het aantal publicaties (d.w.z. de telling van de afhankelijke variabele) 1,044 keer groter zal zijn voor elk extra gewerkt uur per week. Een andere manier om dit te zeggen is dat er een toename van 4,4% is in het aantal publicaties voor elk extra gewerkt uur per week. Een soortgelijke interpretatie kan worden gemaakt voor de categorische variabele.

Het geheel samenvattend

U zou de resultaten van het aantal gewerkte uren per week als volgt kunnen opschrijven:

  • Algemeen

Er is een Poisson regressie uitgevoerd om het aantal publicaties van een academicus in de laatste 12 maanden te voorspellen op basis van de ervaring van de academicus en het aantal uren dat een academicus elke week aan onderzoek besteedt. Voor elk extra uur dat per week aan onderzoek werd besteed, werden 1,044 (95% CI, 1,004 tot 1,085) maal meer publicaties gepubliceerd, een statistisch significant resultaat, p = .030.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.