Analiza de regresie Poisson folosind SPSS Statistics

Introducere

Regresia Poisson este utilizată pentru a prezice o variabilă dependentă care constă în „date de numărare”, având în vedere una sau mai multe variabile independente. Variabila pe care dorim să o prezicem se numește variabila dependentă (sau, uneori, variabila răspuns, rezultat, țintă sau criteriu). Variabilele pe care le folosim pentru a prezice valoarea variabilei dependente se numesc variabile independente (sau, uneori, variabile predictive, explicative sau regresoare). Câteva exemple în care ar putea fi utilizată regresia Poisson sunt descrise mai jos:

  • Exemplul nr. 1: Ați putea utiliza regresia Poisson pentru a examina numărul de elevi suspendați de școlile din Washington, în Statele Unite, pe baza unor predictori precum sexul (fete și băieți), rasa (alb, negru, hispanic, asiatic/insular din Pacific și indian american/nativ din Alaska), limba (engleza este prima lor limbă, engleza nu este prima lor limbă) și statutul de handicap (cu handicap și fără handicap). Aici, „numărul de suspendări” este variabila dependentă, în timp ce „sexul”, „rasa”, „limba” și „statutul de handicap” sunt toate variabile independente nominale.
  • Exemplul nr. 2: Ați putea utiliza regresia Poisson pentru a examina numărul de ori în care persoanele din Australia nu își plătesc ratele de rambursare a cardului de credit într-o perioadă de cinci ani, pe baza unor predictori cum ar fi statutul profesional (angajat, șomer), salariul anual (în dolari australieni), vârsta (în ani), sexul (bărbați și femei) și nivelul șomajului din țară (% șomeri). În acest caz, „numărul de neplăți la rambursarea cardurilor de credit” este variabila dependentă, în timp ce „statutul profesional” și „sexul” sunt variabile independente nominale, iar „salariul anual”, „vârsta” și „nivelul șomajului în țară” sunt variabile independente continue.
  • Exemplul nr. 3: Ați putea utiliza regresia Poisson pentru a examina numărul de persoane care vă precedă în coada de la departamentul de & Urgențe (A&E) al unui spital pe baza unor predictori precum modul de sosire la A&E (ambulanță sau autoînregistrare), gravitatea evaluată a rănii în timpul triajului (ușoară, moderată, severă), ora din zi și ziua din săptămână. Aici, „numărul de persoane care vă precedă la coadă” este variabila dependentă, în timp ce „modul de sosire” este o variabilă independentă nominală, „gravitatea evaluată a rănii” este o variabilă independentă ordinală, iar „ora din zi” și „ziua săptămânii” sunt variabile independente continue.
  • Exemplul nr. 4: Ați putea utiliza regresia Poisson pentru a examina numărul de studenți care primesc nota 1 în cadrul unui program de MBA pe baza unor predictori precum tipurile de cursuri opționale pe care le-au ales (în principal numerice, în principal calitative, un amestec de numerice și calitative) și media generală a acestora la intrarea în program. Aici, „numărul de studenți de clasa I” este variabila dependentă, în timp ce „cursurile opționale” este o variabilă independentă nominală, iar „GPA” este o variabilă independentă continuă.

După ce ați efectuat o regresie Poisson, veți putea determina care dintre variabilele independente (dacă există) au un efect semnificativ din punct de vedere statistic asupra variabilei dependente. Pentru variabilele independente categorice, veți putea determina creșterea sau scăderea procentuală a numărului de persoane dintr-un grup (de exemplu, decesele în rândul „copiilor” care se plimbă pe roller coastere) față de un alt grup (de exemplu, decesele în rândul „adulților” care se plimbă pe roller coastere). Pentru variabilele independente continue, veți putea să interpretați modul în care o creștere sau o scădere de o singură unitate a acelei variabile este asociată cu o creștere sau o scădere procentuală a numărătorii variabilei dumneavoastră dependente (de exemplu, o scădere a salariului cu 1.000 de dolari – variabila independentă – asupra modificării procentuale a numărului de ori în care persoanele din Australia nu-și plătesc ratele la cardul de credit – variabila dependentă).

Acest ghid „quick start” vă arată cum să efectuați regresia Poisson folosind SPSS Statistics, precum și cum să interpretați și să raportați rezultatele acestui test. Cu toate acestea, înainte de a vă prezenta această procedură, trebuie să înțelegeți diferitele ipoteze pe care datele dvs. trebuie să le îndeplinească pentru ca regresia Poisson să vă ofere un rezultat valid. Discutăm aceste ipoteze în continuare.

Nota: În prezent, nu avem o versiune premium a acestui ghid în partea de abonament a site-ului nostru.

SPSS Statistics

Ipoteze

Când alegeți să vă analizați datele folosind regresia Poisson, o parte a procesului implică verificarea pentru a vă asigura că datele pe care doriți să le analizați pot fi analizate efectiv folosind regresia Poisson. Trebuie să faceți acest lucru deoarece este adecvat să folosiți regresia Poisson numai dacă datele dvs. „trec” cinci ipoteze care sunt necesare pentru ca regresia Poisson să vă ofere un rezultat valid. În practică, verificarea acestor cinci ipoteze vă va lua cea mai mare parte din timp atunci când efectuați regresia Poisson. Cu toate acestea, este esențial să faceți acest lucru, deoarece nu este neobișnuit ca datele să fie încălcate (adică să nu îndeplinească) una sau mai multe dintre aceste ipoteze. Cu toate acestea, chiar și atunci când datele dvs. nu respectă unele dintre aceste ipoteze, există adesea o soluție pentru a depăși acest lucru. În primul rând, să analizăm aceste cinci ipoteze:

  • Ipoteza nr. 1: Variabila dvs. dependentă constă în date numerice. Datele de numărare sunt diferite de datele măsurate în alte tipuri bine cunoscute de regresie (de exemplu, regresia liniară și regresia multiplă necesită variabile dependente care sunt măsurate pe o scală „continuă”, regresia logistică binomială necesită o variabilă dependentă măsurată pe o scală „dihotomică”, regresia ordinală necesită o variabilă dependentă măsurată pe o scală „ordinală”, iar regresia logistică multinomială necesită o variabilă dependentă măsurată pe o scală „nominală”). În schimb, variabilele de numărare necesită date întregi care trebuie să fie egale sau mai mari de zero. În termeni simpli, gândiți-vă la un „număr întreg” ca la un număr „întreg” (de exemplu, 0, 1, 5, 8, 354, 888, 23400 etc.). De asemenea, deoarece datele de numărare trebuie să fie „pozitive” (adică să fie formate din valori întregi „nenegative”), acestea nu pot fi formate din valori „minus” (de exemplu, valori precum -1, -5, -8, -354, -888 și -23400 nu ar fi considerate date de numărare). În plus, se sugerează uneori ca regresia Poisson să fie efectuată numai atunci când numărul mediu este o valoare mică (de exemplu, mai mică de 10). În cazul în care există un număr mare de numărători, un alt tip de regresie ar putea fi mai adecvat (de exemplu, regresie multiplă, regresie gamma etc.).
    Exemple de variabile de numărare includ numărul de zboruri întârziate cu mai mult de trei ore pe aeroporturile europene, numărul de elevi suspendați de școlile din Washington în Statele Unite, numărul de ori în care oamenii din Australia nu-și plătesc ratele la cardurile de credit într-o perioadă de cinci ani, numărul de persoane care stau înaintea ta la coadă la secția de Urgențe & Accidente (A&E) a unui spital, numărul de studenți care primesc nota 1 (de obicei, mai puțin de 5) la un program de MBA și numărul de persoane care își pierd viața în accidente de roller coaster în Statele Unite.
  • Ipoteza nr. 2: Aveți una sau mai multe variabile independente, care pot fi măsurate pe o scală continuă, ordinală sau nominală/dicotomică. Variabilele ordinale și nominale/dichotomice pot fi clasificate, în linii mari, ca variabile categorice.
    Exemple de variabile continue includ timpul de revizuire (măsurat în ore), inteligența (măsurată cu ajutorul scorului IQ), performanța la examen (măsurată de la 0 la 100) și greutatea (măsurată în kg). Exemple de variabile ordinale includ elemente Likert (de exemplu, o scală în 7 puncte de la „total de acord” până la „total dezacord”), printre alte modalități de clasificare a categoriilor (de exemplu, o scală în 3 puncte care explică cât de mult i-a plăcut un produs unui client, de la „Nu foarte mult” până la „Da, foarte mult”). Printre exemplele de variabile nominale se numără sexul (de exemplu, două grupuri – bărbați și femei – deci, de asemenea, o variabilă dihotomică), etnia (de exemplu, trei grupuri: caucazieni, afro-americani și hispanici) și profesia (de exemplu, cinci grupuri: chirurg, doctor, asistent medical, dentist, terapeut). Rețineți că variabilele ordinale și nominale/dichotomice pot fi clasificate în linii mari ca variabile categorice. Puteți afla mai multe despre variabile în articolul nostru: Tipuri de variabile.
  • Ipoteza nr. 3: Ar trebui să aveți independența observațiilor. Aceasta înseamnă că fiecare observație este independentă de celelalte observații; adică, o observație nu poate furniza informații despre o altă observație. Aceasta este o ipoteză foarte importantă. Lipsa observațiilor independente este în cea mai mare parte o problemă de proiectare a studiului. O metodă de testare a posibilității de independență a observațiilor este de a compara erorile standard bazate pe model cu erorile robuste pentru a determina dacă există diferențe mari.
  • Ipoteza nr. 4: Distribuția numărătorilor (condiționată de model) urmează o distribuție Poisson. O consecință a acestei ipoteze este că numărătorile observate și cele așteptate ar trebui să fie egale (în realitate, doar foarte asemănătoare). În esență, acest lucru înseamnă că modelul prezice bine numărătorile observate. Acest lucru poate fi testat în mai multe moduri, dar o metodă este de a calcula numărătorile așteptate și de a le reprezenta grafic cu numărătorile observate pentru a vedea dacă acestea sunt similare.
  • Ipoteza #5: Media și varianța modelului sunt identice. Aceasta este o consecință a Ipotezei #4; că există o distribuție Poisson. Pentru o distribuție Poisson, varianța are aceeași valoare ca și media. Dacă îndepliniți această ipoteză, aveți echidispersie. Cu toate acestea, de multe ori nu este cazul, iar datele dvs. sunt fie subdispersate, fie supradispersate, problema cea mai frecventă fiind supradispersarea. Există o varietate de metode pe care le puteți utiliza pentru a evalua supradispersia. O metodă este de a evalua statistica de dispersie Pearson.

Puteți verifica ipotezele nr. 3, 4 și 5 folosind SPSS Statistics. Ipotezele #1 și #2 ar trebui să fie verificate mai întâi, înainte de a trece la ipotezele #3, #4 și #5. Rețineți doar că, dacă nu executați corect testele statistice privind aceste ipoteze, rezultatele pe care le obțineți atunci când executați regresia Poisson ar putea să nu fie valide.

De asemenea, dacă datele dvs. au încălcat ipoteza #5, care este extrem de frecventă atunci când efectuați regresia Poisson, trebuie să verificați mai întâi dacă aveți o „supradispersie Poisson aparentă”. Supradispersia Poisson aparentă este situația în care nu ați specificat corect modelul, astfel încât datele par supradispersate. Prin urmare, dacă modelul Poisson încalcă inițial ipoteza de echidispersie, trebuie să faceți mai întâi o serie de ajustări la modelul Poisson pentru a verifica dacă acesta este într-adevăr supradispersat. Acest lucru necesită efectuarea a șase verificări ale modelului/datelor dumneavoastră: (a) Modelul dvs. Poisson include toți predictorii importanți?; (b) Datele dvs. includ valori aberante?; (c) Regresia dvs. Poisson include toți termenii de interacțiune relevanți?; (d) Este necesară transformarea unora dintre predictori?; (e) Modelul dvs. Poisson necesită mai multe date și/sau datele dvs. sunt prea rarefiate?; și (f) Aveți valori lipsă care nu sunt lipsă la întâmplare (MAR)?

În secțiunea, Procedura, ilustrăm procedura SPSS Statistics pentru a efectua o regresie Poisson presupunând că nu au fost încălcate ipotezele. Mai întâi, prezentăm exemplul care este utilizat în acest ghid.

SPSS Statistics

Exemplu & Configurare în SPSS Statistics

Directorul de cercetare al unei universități mici dorește să evalueze dacă experiența unui cadru didactic și timpul pe care îl are la dispoziție pentru a efectua cercetări influențează numărul de publicații pe care le produce. Prin urmare, un eșantion aleatoriu de 21 de cadre didactice din universitate este rugat să participe la cercetare: 10 sunt cadre universitare cu experiență și 11 sunt cadre universitare recente. Se înregistrează numărul de ore pe care le-au dedicat cercetării în ultimele 12 luni și numărul de publicații peer-reviewed pe care le-au generat.

Pentru a configura acest design de studiu în SPSS Statistics, am creat trei variabile: (1) no_of_publications, care reprezintă numărul de publicații pe care universitarul le-a publicat în reviste de specialitate în ultimele 12 luni; (2) experience_of_academic, care reflectă dacă universitarul este experimentat (adică a lucrat în mediul academic timp de 10 ani sau mai mult și, prin urmare, este clasificat ca „Universitar experimentat”) sau a devenit recent un universitar (de ex, lucrează în mediul academic de mai puțin de 3 ani, dar de cel puțin un an, și, prin urmare, este clasificat drept „academician recent”); și (3) no_of_weekly_hours, care reprezintă numărul de ore pe care un academician le are la dispoziție în fiecare săptămână pentru a lucra la cercetare.

SPSS Statistics

Procedură de testare în SPSS Statistics

Cei 13 pași de mai jos vă arată cum să vă analizați datele folosind regresia Poisson în SPSS Statistics atunci când niciuna dintre cele cinci ipoteze din secțiunea anterioară, Ipoteze, nu a fost încălcată. La sfârșitul acestor 13 pași, vă arătăm cum să interpretați rezultatele regresiei Poisson.

  1. Click Analyze > Generalized Linear Models > Generalized Linear Models > Generalized Linear Models… din meniul principal, așa cum se arată mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

    Vă va fi prezentată caseta de dialog Generalized Linear Models de mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  2. Selectați Poisson loglinear în zona , așa cum se arată mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

    Rețineți: Deși este standard să selectați Poisson loglinear în zona pentru a efectua o regresie Poisson, puteți alege, de asemenea, să executați o regresie Poisson personalizată selectând Custom (Personalizat) în zona și apoi să specificați tipul de model Poisson pe care doriți să îl executați folosind opțiunile Distribution: (Distribuție), Link function: (Funcție de legătură) și -Parameter- (Parametru).

  3. Selectați fila . Vi se va prezenta următoarea casetă de dialog:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  4. Transferați variabila dvs. dependentă, no_of_publications, în caseta Dependent variable: din zona folosind butonul , așa cum se arată mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  5. Select the tab. Vi se va prezenta următoarea casetă de dialog:

    Publicată cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  6. Transferați variabila independentă categorială, experience_of_academic, în caseta Factors: și variabila independentă continuă, no_of_weekly_hours, în caseta Covariates:, folosind butoanele , așa cum se arată mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

    Nota 1: Dacă aveți variabile independente ordinale, trebuie să decideți dacă acestea vor fi tratate ca fiind categorice și introduse în caseta Factors: sau tratate ca fiind continue și introduse în caseta Covariates:. Acestea nu pot fi introduse într-o regresie Poisson ca variabile ordinale.

    Nota 2: În timp ce este tipic să introduceți variabile independente continue în caseta Covariates:, este posibil să introduceți în schimb variabile independente ordinale. Cu toate acestea, dacă alegeți să faceți acest lucru, variabila independentă ordinală va fi tratată ca fiind continuă.

    Nota 3: Dacă faceți clic pe butonul , va apărea următoarea casetă de dialog:

    În zona -Category Order for Factors- puteți alege între opțiunile Ascending, Descending și Use data order. Acestea sunt utile deoarece SPSS Statistics transformă automat variabilele dvs. categoriale în variabile fictive. Dacă nu sunteți familiarizat cu variabilele fictive, acest lucru poate face puțin mai dificilă interpretarea rezultatului unei regresii Poisson pentru fiecare dintre grupurile variabilelor dvs. categoriale. Prin urmare, efectuarea de modificări ale opțiunilor din zona -Category Order for Factors- poate face mai ușoară interpretarea rezultatului dumneavoastră.

  7. Select the tab. Vi se va prezenta următoarea casetă de dialog:

    Publicată cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  8. Păstrați valoarea implicită de în zona -Build Term(s)- și transferați variabilele independente categorice și continue, experience_of_academic și no_of_of_weekly_hours, din caseta Factors and Covariates: în caseta Model:, folosind butonul , așa cum se arată mai jos:

    Published with written permission from SPSS Statistics, IBM Corporation.

    Nota 1: În caseta de dialog se construiește modelul Poisson. În special, determinați ce efecte principale aveți (opțiunea ), precum și dacă vă așteptați să existe interacțiuni între variabilele dumneavoastră independente (opțiunea ). Dacă bănuiți că aveți interacțiuni între variabilele dvs. independente, includerea acestora în modelul dvs. este importantă nu numai pentru a îmbunătăți predicția modelului dvs., ci și pentru a evita problemele de supradispersie, așa cum s-a subliniat mai devreme în secțiunea Ipoteze.
    În timp ce noi oferim un exemplu pentru un model foarte simplu, cu un singur efect principal (între variabilele independente categorice și continue, experience_of_academic și no_of_of_weekly_hours), puteți introduce cu ușurință modele mai complexe folosind , , , . , și din zona -Build Term(s)-, în funcție de tipul de efecte principale și interacțiuni pe care le aveți în modelul dumneavoastră.

    Nota 2: Puteți, de asemenea, să construiți termeni imbricați în modelul dumneavoastră adăugându-i în caseta Term: din zona -Build Nested Term-. Noi nu avem efecte imbricate în acest model, dar există multe scenarii în care ați putea avea termeni imbricați în modelul dumneavoastră.

  9. Selectați fila . Vi se va prezenta următoarea casetă de dialog:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  10. Măstrați opțiunile implicite selectate.

    Nota: Există o serie de opțiuni diferite pe care le puteți selecta în zona -Parameter Estimation-, inclusiv posibilitatea de a alege un parametru diferit: (a) metoda parametrilor de scară (adică, sau în loc de în caseta Scale Parameter Method:), care ar putea fi luată în considerare pentru a rezolva problemele de supradispersie; și (b) matricea de covarianță (adică, Robust estimator în loc de Model-based estimator în zona -Covariance Matrix-), care prezintă o altă opțiune potențială (printre altele) pentru a rezolva problemele de supradispersie.
    Există, de asemenea, o serie de specificații pe care le puteți face în zona -Iterations- pentru a face față problemelor de neconvergență în modelul Poisson.

  11. Selectați fila . Vi se va prezenta următoarea casetă de dialog:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

  12. Select Include exponential parameter estimates în zona , așa cum se arată mai jos:

    Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

    Nota 1: În zona , puteți alege între raportul Wald și raportul de verosimilitate pe baza unor factori cum ar fi dimensiunea eșantionului și implicațiile pe care acest lucru le poate avea asupra acurateței testării semnificației statistice.
    În zona , testul multiplicatorului Lagrange poate fi, de asemenea, util pentru a determina dacă modelul Poisson este adecvat pentru datele dumneavoastră (deși acesta nu poate fi executat folosind procedura de regresie Poisson).

    Nota 2: Puteți selecta, de asemenea, o gamă largă de alte opțiuni din filele și . Acestea includ opțiuni care sunt importante atunci când examinați diferențele dintre grupurile variabilelor dvs. categoriale, precum și testarea ipotezelor regresiei Poisson, așa cum s-a discutat anterior în secțiunea Ipoteze.

  13. Click pe butonul . Acest lucru va genera rezultatul.

SPSS Statistics

Interpretarea și raportarea rezultatelor analizei de regresie Poisson

SPSS Statistics va genera destul de multe tabele de ieșire pentru o analiză de regresie Poisson. În această secțiune, vă prezentăm cele opt tabele principale necesare pentru a înțelege rezultatele procedurii de regresie Poisson, presupunând că nu au fost încălcate ipotezele.

Informații despre model și variabile

Primul tabel de ieșire este tabelul de informații despre model (așa cum se arată mai jos). Aceasta confirmă faptul că variabila dependentă este „Numărul de publicații”, distribuția de probabilitate este „Poisson” și funcția de legătură este logaritmul natural (adică „Log”). Dacă executați o regresie Poisson pe propriile date, numele variabilei dependente va fi diferit, dar distribuția de probabilitate și funcția de legătură vor fi aceleași.

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Cel de-al doilea tabel, Case Processing Summary, vă arată câte cazuri (de ex, subiecți) au fost incluse în analiza dvs. (rândul „Inclus”) și câte nu au fost incluse (rândul „Exclus”), precum și procentul din ambele. Puteți considera că rândul „Excluded” indică cazurile (de exemplu, subiecții) care au avut una sau mai multe valori lipsă. După cum puteți vedea mai jos, au existat 21 de subiecți în această analiză, fără subiecți excluși (adică fără valori lipsă).

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Tabelul Informații despre variabilele categorice evidențiază numărul și procentul de cazuri (de exemplu, subiecți) din fiecare grup al fiecărei variabile categorice independente din analiza dumneavoastră. În această analiză, există o singură variabilă independentă categorială (cunoscută și sub numele de „factor”), care a fost experiența_de_academie. Puteți vedea că grupurile sunt destul de echilibrate din punct de vedere numeric între cele două grupuri (de exemplu, 10 față de 11). Dimensiunile foarte dezechilibrate ale grupurilor pot cauza probleme cu ajustarea modelului, dar putem vedea că nu există nicio problemă în acest caz.

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Tabloul Continuous Variable Information (Informații despre variabila continuă) poate oferi o verificare rudimentară a datelor pentru orice problemă, dar este mai puțin utilă decât alte statistici descriptive pe care le puteți rula separat înainte de a rula regresia Poisson. Cel mai bun rezultat pe care îl puteți obține din acest tabel este acela de a înțelege dacă ar putea exista o supradispersie în analiza dumneavoastră (de exemplu, ipoteza nr. 5 a regresiei Poisson). Puteți face acest lucru luând în considerare raportul dintre varianță (pătratul coloanei „Std. Deviation”) și medie (coloana „Mean”) pentru variabila dependentă. Puteți vedea aceste cifre mai jos:

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Media este 2,29 și varianța este 2,81 (1,677582), ceea ce reprezintă un raport de 2,81 ÷ 2,29 = 1,23. O distribuție Poisson presupune un raport de 1 (adică media și varianța sunt egale). Prin urmare, putem observa că, înainte de a adăuga orice variabile explicative, există o cantitate mică de supradispersie. Cu toate acestea, trebuie să verificăm această ipoteză atunci când toate variabilele independente au fost adăugate la regresia Poisson. Acest lucru este discutat în secțiunea următoare.

Determinarea modului în care se potrivește modelul

Tabloul Goodness of Fit oferă mai multe măsuri care pot fi utilizate pentru a evalua modul în care se potrivește modelul. Cu toate acestea, ne vom concentra asupra valorii din coloana „Value/df” pentru rândul „Pearson Chi-Square”, care este de 1,108 în acest exemplu, după cum se arată mai jos:

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

O valoare de 1 indică o echidispersie, în timp ce valorile mai mari de 1 indică o supradispersie, iar valorile sub 1 indică o subdispersie. Cel mai frecvent tip de încălcare a ipotezei de echidispersie este supradispersia. Cu o dimensiune atât de mică a eșantionului în acest exemplu, este puțin probabil ca o valoare de 1,108 să reprezinte o încălcare gravă a acestei ipoteze.

Tabelul Omnibus Test se încadrează undeva între această secțiune și următoarea. Este un test al raportului de verosimilitate pentru a vedea dacă toate variabilele independente îmbunătățesc în mod colectiv modelul față de modelul bazat doar pe intercept (adică fără adăugarea de variabile independente). Având toate variabilele independente în modelul nostru de exemplu, avem o valoare p de 0,006 (adică, p = 0,006), ceea ce indică un model general semnificativ din punct de vedere statistic, așa cum se arată mai jos în coloana „Sig.”:

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Acum că știți că adăugarea tuturor variabilelor independente generează un model semnificativ din punct de vedere statistic, veți dori să știți care variabile independente specifice sunt semnificative din punct de vedere statistic. Acest lucru este discutat în secțiunea următoare.

Efectele modelului și semnificația statistică a variabilelor independente

Tabloul Tests of Model Effects (așa cum se arată mai jos) afișează semnificația statistică a fiecăreia dintre variabilele independente în coloana „Sig.”:

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

De obicei, nu există niciun interes pentru interceptul modelului. Cu toate acestea, putem observa că experiența universitarului nu a fost semnificativă din punct de vedere statistic (p = 0,644), dar numărul de ore lucrate pe săptămână a fost semnificativ din punct de vedere statistic (p = 0,030). Acest tabel este util mai ales pentru variabilele independente categorice, deoarece este singurul tabel care ia în considerare efectul global al unei variabile categorice, spre deosebire de tabelul Parameter Estimates, așa cum se arată mai jos:

Publicat cu permisiunea scrisă a SPSS Statistics, IBM Corporation.

Acest tabel oferă atât estimările coeficienților (coloana „B”) ale regresiei Poisson, cât și valorile exponențializate ale coeficienților (coloana „Exp(B)”). De obicei, acestea din urmă sunt cele mai informative. Aceste valori exponențiate pot fi interpretate în mai multe moduri, iar noi vă vom arăta unul dintre acestea în acest ghid. Luați în considerare, de exemplu, numărul de ore lucrate săptămânal (și anume, rândul „no_of_weekly_hours”). Valoarea exponențiată este 1,044. Aceasta înseamnă că numărul de publicații (adică numărul variabilei dependente) va fi de 1,044 ori mai mare pentru fiecare oră suplimentară lucrată pe săptămână. Un alt mod de a spune acest lucru este că există o creștere de 4,4% a numărului de publicații pentru fiecare oră suplimentară lucrată pe săptămână. O interpretare similară poate fi făcută pentru variabila categorică.

Punând totul cap la cap

Ați putea scrie rezultatele numărului de ore lucrate pe săptămână după cum urmează:

  • Generalități

A fost rulată o regresie Poisson pentru a prezice numărul de publicații pe care un universitar le publică în ultimele 12 luni pe baza experienței universitarului și a numărului de ore pe care un universitar le petrece în fiecare săptămână lucrând la cercetare. Pentru fiecare oră suplimentară lucrată pe săptămână în cercetare, au fost publicate de 1,044 (IC 95%, 1,004 – 1,085) ori mai multe publicații, un rezultat semnificativ din punct de vedere statistic, p = 0,030.

Lasă un răspuns

Adresa ta de email nu va fi publicată.