Wprowadzenie
Regresja Poissona jest używana do przewidywania zmiennej zależnej, która składa się z „danych zliczanych”, biorąc pod uwagę jedną lub więcej zmiennych niezależnych. Zmienna, którą chcemy przewidzieć, nazywana jest zmienną zależną (lub czasami zmienną odpowiedzi, wyniku, celu lub kryterium). Zmienne, których używamy do przewidywania wartości zmiennej zależnej, nazywane są zmiennymi niezależnymi (lub czasami zmiennymi przewidującymi, objaśniającymi lub regresorami). Poniżej opisano kilka przykładów zastosowania regresji Poissona:
- Przykład #1: Można użyć regresji Poissona do zbadania liczby uczniów zawieszonych przez szkoły w Waszyngtonie w Stanach Zjednoczonych w oparciu o predyktory takie jak płeć (dziewczęta i chłopcy), rasa (biali, czarni, Latynosi, Azjaci/ Wyspiarze Pacyfiku i rdzenni mieszkańcy Indii Amerykańskich/Alaski), język (angielski jest ich pierwszym językiem, angielski nie jest ich pierwszym językiem) i status niepełnosprawności (niepełnosprawni i pełnosprawni). Tutaj „liczba zawieszeń” jest zmienną zależną, podczas gdy „płeć”, „rasa”, „język” i „status niepełnosprawności” są nominalnymi zmiennymi niezależnymi.
- Przykład #2: Można użyć regresji Poissona do zbadania liczby przypadków, w których ludzie w Australii zalegają ze spłatą kart kredytowych w okresie pięciu lat, w oparciu o predyktory takie jak status zawodowy (zatrudniony, bezrobotny), roczne wynagrodzenie (w dolarach australijskich), wiek (w latach), płeć (mężczyzna i kobieta) oraz poziom bezrobocia w kraju (% bezrobotnych). Tutaj „liczba przypadków niespłacenia karty kredytowej” jest zmienną zależną, podczas gdy „status zawodowy” i „płeć” są nominalnymi zmiennymi niezależnymi, a „roczna pensja”, „wiek” i „poziom bezrobocia w kraju” są ciągłymi zmiennymi niezależnymi.
- Przykład #3: Mógłbyś użyć regresji Poissona do zbadania liczby osób przed tobą w kolejce na oddziale Accident & Emergency (A&E) szpitala w oparciu o predyktory takie jak tryb przybycia na A&E (karetka lub samodzielna odprawa), oceniony stopień ciężkości urazu podczas triage (łagodny, umiarkowany, ciężki), pora dnia i dzień tygodnia. Tutaj, „liczba osób przed tobą w kolejce” jest zmienną zależną, podczas gdy „sposób przybycia” jest nominalną zmienną niezależną, „oceniona ciężkość urazu” jest porządkową zmienną niezależną, a „pora dnia” i „dzień tygodnia” są ciągłymi zmiennymi niezależnymi.
- Przykład #4: Można użyć regresji Poissona do zbadania liczby studentów, którzy otrzymują ocenę 1 klasy w programie MBA w oparciu o predyktory takie jak rodzaje kursów fakultatywnych, które wybrali (głównie numeryczne, głównie jakościowe, mieszane numeryczne i jakościowe) oraz ich GPA przy wejściu do programu. Tutaj „liczba studentów 1 klasy” jest zmienną zależną, podczas gdy „kursy opcjonalne” są nominalną zmienną niezależną, a „GPA” jest ciągłą zmienną niezależną.
Przeprowadziwszy regresję Poissona, będziesz w stanie określić, które z twoich zmiennych niezależnych (jeśli w ogóle) mają statystycznie istotny wpływ na twoją zmienną zależną. Dla kategorycznych zmiennych niezależnych będziesz w stanie określić procentowy wzrost lub spadek liczebności jednej grupy (np. zgonów wśród „dzieci” jeżdżących na kolejkach górskich) w stosunku do innej (np. zgonów wśród „dorosłych” jeżdżących na kolejkach górskich). Dla ciągłych zmiennych niezależnych będziesz w stanie zinterpretować, jak jednostkowy wzrost lub spadek tej zmiennej jest związany z procentowym wzrostem lub spadkiem liczebności twojej zmiennej zależnej (np. spadek o 1000 dolarów pensji – zmiennej niezależnej – na procentową zmianę liczby przypadków, w których ludzie w Australii nie wywiązują się ze spłaty karty kredytowej – zmiennej zależnej).
Ten przewodnik „szybkiego startu” pokazuje, jak przeprowadzić regresję Poissona przy użyciu SPSS Statistics, a także interpretować i raportować wyniki tego testu. Jednakże, zanim wprowadzimy Cię do tej procedury, musisz zrozumieć różne założenia, które Twoje dane muszą spełniać, aby regresja Poissona dała Ci prawidłowy wynik. Omówimy te założenia poniżej.
Uwaga: Obecnie nie mamy wersji premium tego przewodnika w subskrypcyjnej części naszej witryny.
SPSS Statistics
Założenia
Gdy zdecydujesz się analizować swoje dane za pomocą regresji Poissona, część procesu obejmuje sprawdzenie, czy dane, które chcesz analizować, mogą być rzeczywiście analizowane za pomocą regresji Poissona. Należy to zrobić, ponieważ regresję Poissona można stosować tylko wtedy, gdy dane „przejdą” pięć założeń, które są wymagane, aby regresja Poissona dała prawidłowy wynik. W praktyce, sprawdzenie tych pięciu założeń zajmie większość czasu podczas przeprowadzania regresji Poissona. Jest to jednak bardzo ważne, ponieważ nierzadko zdarza się, że dane naruszają (tj. nie spełniają) jedno lub więcej z tych założeń. Jednak nawet jeśli dane nie spełniają niektórych z tych założeń, często istnieje rozwiązanie, aby temu zaradzić. Po pierwsze, spójrzmy na te pięć założeń:
- Założenie #1: Twoja zmienna zależna składa się z danych liczonych. Dane zliczane różnią się od danych mierzonych w innych dobrze znanych typach regresji (np. regresja liniowa i regresja wieloraka wymagają zmiennych zależnych mierzonych na skali „ciągłej”, dwumianowa regresja logistyczna wymaga zmiennej zależnej mierzonej na skali „dychotomicznej”, regresja porządkowa wymaga zmiennej zależnej mierzonej na skali „porządkowej”, a wielomianowa regresja logistyczna wymaga zmiennej zależnej mierzonej na skali „nominalnej”). W przeciwieństwie do tego, zmienne zliczeniowe wymagają danych całkowitych, które muszą wynosić zero lub więcej. W prostych słowach, pomyśl o „liczbie całkowitej” jako o „całej” liczbie (np. 0, 1, 5, 8, 354, 888, 23400, itd.). Ponadto, ponieważ dane zliczające muszą być „pozytywne” (tzn. składać się z „nieujemnych” wartości całkowitych), nie mogą składać się z wartości „minusowych” (np. wartości takie jak -1, -5, -8, -354, -888 i -23400 nie byłyby uważane za dane zliczające). Ponadto czasami sugeruje się, aby regresję Poissona przeprowadzać tylko wtedy, gdy średnia liczba zliczeń jest małą wartością (np. mniejszą niż 10). W przypadku dużej liczby zliczeń bardziej odpowiedni może być inny rodzaj regresji (np. regresja wielokrotna, regresja gamma itp.).
- Założenie #2: Masz jedną lub więcej zmiennych niezależnych, które mogą być mierzone na skali ciągłej, porządkowej lub nominalnej/dychotomicznej. Zmienne porządkowe i nominalne/dychotomiczne mogą być szeroko sklasyfikowane jako zmienne kategoryczne.
Przykłady zmiennych ciągłych obejmują czas rewizji (mierzony w godzinach), inteligencję (mierzoną za pomocą wyniku IQ), wyniki egzaminów (mierzone od 0 do 100) i wagę (mierzoną w kg). Przykłady zmiennych porządkowych obejmują pozycje Likerta (np. 7-punktowa skala od „zdecydowanie się zgadzam” do „zdecydowanie się nie zgadzam”), wśród innych sposobów szeregowania kategorii (np. 3-punktowa skala określająca, jak bardzo klientowi podobał się produkt, od „niezbyt” do „tak, bardzo”). Przykłady zmiennych nominalnych obejmują płeć (np. dwie grupy – mężczyzna i kobieta – a więc również zmienna dychotomiczna), pochodzenie etniczne (np. trzy grupy: kaukaska, afroamerykańska i latynoska) oraz zawód (np. pięć grup: chirurg, lekarz, pielęgniarka, dentysta, terapeuta). Pamiętaj, że zmienne porządkowe i nominalne/dychotomiczne mogą być szeroko klasyfikowane jako zmienne kategoryczne. Więcej na temat zmiennych dowiesz się w naszym artykule: Rodzaje zmiennych.- Założenie #3: Powinieneś mieć niezależność obserwacji. Oznacza to, że każda obserwacja jest niezależna od innych obserwacji, to znaczy, że jedna obserwacja nie może dostarczyć żadnych informacji o innej obserwacji. Jest to bardzo ważne założenie. Brak niezależnych obserwacji jest najczęściej problemem związanym z projektem badania. Jedną z metod testowania możliwości niezależności obserwacji jest porównanie standardowych błędów opartych na modelu z błędami odpornymi w celu określenia, czy istnieją duże różnice.
- Założenie #4: Rozkład liczebności (warunkowy dla modelu) jest rozkładem Poissona. Jedną z konsekwencji tego jest to, że obserwowane i oczekiwane zliczenia powinny być równe (w rzeczywistości po prostu bardzo podobne). Zasadniczo oznacza to, że model dobrze przewiduje zaobserwowane liczby. Można to sprawdzić na wiele sposobów, ale jedną z metod jest obliczenie oczekiwanych liczebności i wykreślenie ich z liczebnościami obserwowanymi, aby zobaczyć, czy są podobne.
- Założenie nr 5: Średnia i wariancja modelu są identyczne. Jest to konsekwencja założenia nr 4, że mamy do czynienia z rozkładem Poissona. Dla rozkładu Poissona wariancja ma taką samą wartość jak średnia. Jeśli spełniasz to założenie, masz równomierną dyspersję. Jednak często tak nie jest i dane są albo niedostatecznie rozproszone albo nadmiernie rozproszone, przy czym nadmierne rozproszenie jest najczęstszym problemem. Istnieje wiele metod, które można wykorzystać do oceny nadmiernej dyspersji. Jedną z nich jest statystyka dyspersji Pearsona.
- Założenie #2: Masz jedną lub więcej zmiennych niezależnych, które mogą być mierzone na skali ciągłej, porządkowej lub nominalnej/dychotomicznej. Zmienne porządkowe i nominalne/dychotomiczne mogą być szeroko sklasyfikowane jako zmienne kategoryczne.
Założenia #3, #4 i #5 można sprawdzić za pomocą SPSS Statistics. Założenia #1 i #2 powinny być sprawdzone jako pierwsze, przed przejściem do założeń #3, #4 i #5. Pamiętaj, że jeśli nie przeprowadzisz testów statystycznych na tych założeniach poprawnie, wyniki, które otrzymasz podczas regresji Poissona mogą nie być ważne.
Jeśli twoje dane naruszyły założenie #5, co jest bardzo powszechne podczas przeprowadzania regresji Poissona, musisz najpierw sprawdzić, czy masz „pozorną naddyspersję Poissona”. Pozorna naddyspersja Poissona to sytuacja, w której nie określiłeś poprawnie modelu, tak że dane wydają się nadmiernie rozproszone. Dlatego, jeśli Twój model Poissona początkowo narusza założenie o równomiernym rozproszeniu, powinieneś najpierw dokonać kilku korekt w modelu Poissona, aby sprawdzić, czy jest on rzeczywiście nadmiernie rozproszony. Wymaga to przeprowadzenia sześciu kontroli modelu/danych: (a) Czy Twój model Poissona obejmuje wszystkie istotne predyktory?; (b) Czy Twoje dane zawierają wartości odstające?; (c) Czy Twoja regresja Poissona obejmuje wszystkie istotne warunki interakcji?; (d) Czy któryś z Twoich predyktorów wymaga przekształcenia?; (e) Czy Twój model Poissona wymaga większej ilości danych i/lub czy Twoje dane są zbyt rzadkie?(f) Czy masz brakujące wartości, które nie są brakiem losowym (MAR)?
W rozdziale, Procedura, ilustrujemy procedurę SPSS Statistics do wykonania regresji Poissona zakładając, że żadne założenia nie zostały naruszone. Najpierw przedstawiamy przykład, który jest wykorzystywany w tym przewodniku.
SPSS Statistics
Przykład &Ustawienie w SPSS Statistics
Dyrektor ds. badań małego uniwersytetu chce ocenić, czy doświadczenie pracownika naukowego i czas, jakim dysponuje na prowadzenie badań, wpływa na liczbę tworzonych przez niego publikacji. Dlatego do udziału w badaniu poproszono losowo wybraną próbę 21 nauczycieli akademickich z uczelni: 10 to doświadczeni nauczyciele akademiccy, a 11 to nauczyciele akademiccy od niedawna. Liczba godzin, które spędzili na badaniach w ciągu ostatnich 12 miesięcy i liczba recenzowanych publikacji, które wygenerowali, są rejestrowane.
Aby skonfigurować ten projekt badania w SPSS Statistics, stworzyliśmy trzy zmienne: (1) no_of_publications, która jest liczbą publikacji, które akademik opublikował w recenzowanych czasopismach w ciągu ostatnich 12 miesięcy; (2) experience_of_academic, która odzwierciedla, czy akademik jest doświadczony (tj. pracował w środowisku akademickim przez 10 lat lub więcej, a zatem jest klasyfikowany jako „Experienced academic”) lub niedawno został akademikiem (tj, pracował w środowisku akademickim przez mniej niż 3 lata, ale co najmniej rok, i jest zatem sklasyfikowany jako „Niedawny akademik”); i (3) no_of_weekly_hours, która jest liczbą godzin, które pracownik akademicki ma dostępne w każdym tygodniu, aby pracować nad badaniami.
SPSS Statistics
Procedura testowa w SPSS Statistics
Trzynaście poniższych kroków pokazuje, jak analizować dane przy użyciu regresji Poissona w SPSS Statistics, gdy żadne z pięciu założeń w poprzedniej sekcji, Założenia, nie zostało naruszone. Na końcu tych 13 kroków pokażemy, jak zinterpretować wyniki regresji Poissona.
- Kliknij Analizuj > Uogólnione modele liniowe… w menu głównym, jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Pojawi się poniższe okno dialogowe Generalized Linear Models:
Published with written permission from SPSS Statistics, IBM Corporation.
- Wybierz opcję Poisson loglinear w obszarze , jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Uwaga: Chociaż standardem jest wybranie opcji Poisson loglinear w obszarze w celu przeprowadzenia regresji Poissona, można również uruchomić niestandardową regresję Poissona, wybierając opcję Custom w obszarze , a następnie określając typ modelu Poissona, który ma zostać uruchomiony przy użyciu opcji Distribution:, Link function: i -Parameter-.
- Wybierz kartę . Zostanie wyświetlone następujące okno dialogowe:
Published with written permission from SPSS Statistics, IBM Corporation.
- Przenieś swoją zmienną zależną, no_of_publications, do pola Dependent variable: w obszarze za pomocą przycisku , jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
- Wybierz zakładkę . Zostanie wyświetlone następujące okno dialogowe:
Published with written permission from SPSS Statistics, IBM Corporation.
- Przenieś kategoryczną zmienną niezależną, experience_of_academic, do pola Factors: i ciągłą zmienną niezależną, no_of_weekly_hours, do pola Covariates:, używając przycisków , jak pokazano poniżej:
Opublikowano za pisemną zgodą SPSS Statistics, IBM Corporation.
Uwaga 1: Jeśli masz rzędowe zmienne niezależne, musisz zdecydować, czy mają one być traktowane jako kategoryczne i wprowadzone do pola Czynniki:, czy traktowane jako ciągłe i wprowadzone do pola Zmienne:. Nie mogą być one wprowadzone do regresji Poissona jako zmienne porządkowe.
Uwaga 2: Chociaż typowe jest wprowadzanie ciągłych zmiennych niezależnych do pola Covariates:, możliwe jest wprowadzenie zamiast nich rzędowych zmiennych niezależnych. Jednakże, jeśli się na to zdecydujesz, twoja rzędowa zmienna niezależna będzie traktowana jako ciągła.
Uwaga 3: Jeśli klikniesz na przycisk pojawi się następujące okno dialogowe:
W obszarze -Category Order for Factors- możesz wybrać pomiędzy opcjami Ascending, Descending i Use data order. Są one przydatne, ponieważ SPSS Statistics automatycznie zamienia zmienne kategoryczne na zmienne dummy. Jeśli nie jesteś zaznajomiony ze zmiennymi dummy, może to trochę utrudnić interpretację danych wyjściowych regresji Poissona dla każdej z grup zmiennych kategorycznych. Dlatego wprowadzenie zmian w opcjach w obszarze -Category Order for Factors- może ułatwić interpretację danych wyjściowych. - Wybierz zakładkę . Zostanie wyświetlone następujące okno dialogowe:
Published with written permission from SPSS Statistics, IBM Corporation.
- Zachowaj domyślną wartość w obszarze -Build Term(s)- i przenieś kategoryczne i ciągłe zmienne niezależne, experience_of_academic i no_of_weekly_hours, z pola Factors and Covariates: do pola Model:, używając przycisku , jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Uwaga 1: To właśnie w oknie dialogowym budujesz swój model Poissona. W szczególności określasz, jakie masz efekty główne (opcja ), a także czy spodziewasz się interakcji między zmiennymi niezależnymi (opcja ). Jeśli podejrzewasz, że masz interakcje między zmiennymi niezależnymi, włączenie ich do modelu jest ważne nie tylko w celu poprawy przewidywań modelu, ale także w celu uniknięcia problemów z nadmiernym rozproszeniem, jak podkreślono w sekcji Założenia wcześniej.
Podajemy przykład bardzo prostego modelu z pojedynczym efektem głównym (pomiędzy kategorycznymi i ciągłymi zmiennymi niezależnymi, doświadczenie_naukowe i brak_of_weekly_hours), ale możesz łatwo wprowadzić bardziej złożone modele używając , , . i opcji w obszarze -Build Term(s)- w zależności od rodzaju efektów głównych i interakcji, które masz w swoim modelu.Uwaga 2: Możesz również wbudować zagnieżdżone terminy do swojego modelu, dodając je do pola Term: w obszarze -Build Nested Term-. W tym modelu nie mamy zagnieżdżonych efektów, ale istnieje wiele scenariuszy, w których możesz mieć zagnieżdżone terminy w swoim modelu.
- Wybierz zakładkę . Zostanie wyświetlone następujące okno dialogowe:
Published with written permission from SPSS Statistics, IBM Corporation.
- Zachowaj wybrane opcje domyślne.
Uwaga: Istnieje wiele różnych opcji, które można wybrać w obszarze -Parameter Estimation-, w tym możliwość wybrania innej: (a) metody parametru skali (tj. lub zamiast w polu Scale Parameter Method:), która może być rozważana w celu poradzenia sobie z kwestiami nadmiernego rozproszenia; oraz (b) macierzy kowariancji (tj. Robust estimator zamiast Model-based estimator w obszarze -Covariance Matrix-), która przedstawia inną potencjalną opcję (między innymi) radzenia sobie z kwestiami nadmiernego rozproszenia.
Istnieje również szereg specyfikacji, które można wprowadzić w obszarze -Iterations-, aby poradzić sobie z kwestiami braku zbieżności w modelu Poissona. - Wybierz zakładkę . Zostanie wyświetlone następujące okno dialogowe:
Published with written permission from SPSS Statistics, IBM Corporation.
- Wybierz opcję Include exponential parameter estimates w obszarze , jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Uwaga 1: W obszarze można wybrać między współczynnikiem Walda a współczynnikiem prawdopodobieństwa w oparciu o takie czynniki, jak wielkość próby i implikacje, jakie może to mieć dla dokładności testowania istotności statystycznej.
W obszarze test mnożnika Lagrange’a może być również przydatny do określenia, czy model Poissona jest odpowiedni dla danych (chociaż nie można go przeprowadzić przy użyciu procedury regresji Poissona).Uwaga 2: Można również wybrać szeroki zakres innych opcji z kart i . Obejmują one opcje, które są ważne przy badaniu różnic między grupami Twoich zmiennych kategorycznych, jak również przy testowaniu założeń regresji Poissona, omówionych wcześniej w sekcji Założenia.
- Kliknij przycisk . Spowoduje to wygenerowanie danych wyjściowych.
SPSS Statistics
Interpretacja i raportowanie danych wyjściowych analizy regresji Poissona
SPSS Statistics wygeneruje wiele tabel danych wyjściowych dla analizy regresji Poissona. W tym rozdziale pokażemy osiem głównych tabel wymaganych do zrozumienia wyników z procedury regresji Poissona, zakładając, że żadne założenia nie zostały naruszone.
Informacje o modelu i zmiennych
Pierwszą tabelą w danych wyjściowych jest tabela Informacje o modelu (jak pokazano poniżej). Potwierdza ona, że zmienną zależną jest „Liczba publikacji”, rozkład prawdopodobieństwa to „Poisson”, a funkcja łącząca to logarytm naturalny (tj. „Log”). Jeśli przeprowadzasz regresję Poissona na własnych danych, nazwa zmiennej zależnej będzie inna, ale rozkład prawdopodobieństwa i funkcja łącza będą takie same.
Published with written permission from SPSS Statistics, IBM Corporation.
Druga tabela, Case Processing Summary, pokazuje, ile przypadków (np., badanych) zostało włączonych do analizy (wiersz „Włączone”), a ile nie zostało włączonych (wiersz „Wykluczone”), jak również procent obu. Możesz myśleć o wierszu „Wykluczeni” jako wskazującym przypadki (np. przedmioty), które miały jedną lub więcej brakujących wartości. Jak widać poniżej, w tej analizie było 21 podmiotów, przy czym żaden z nich nie został wykluczony (tzn. nie brakowało żadnych wartości).
Publikacja opublikowana za pisemną zgodą SPSS Statistics, IBM Corporation.
W tabeli Informacje o zmiennych kategorycznych podkreślono liczbę i odsetek przypadków (np. podmiotów) w każdej grupie każdej niezależnej zmiennej kategorycznej w analizie. W tej analizie istnieje tylko jedna niezależna zmienna kategoryczna (zwana również „czynnikiem”), którą było doświadczenie_of_academic. Można zauważyć, że liczebność grup jest dość zrównoważona (np. 10 vs. 11). Wysoce niezrównoważone rozmiary grup mogą powodować problemy z dopasowaniem modelu, ale widzimy, że w tym przypadku nie ma problemu.
Publikowane za pisemną zgodą SPSS Statistics, IBM Corporation.
Tabela informacji o zmiennych ciągłych może zapewnić podstawowe sprawdzenie danych pod kątem problemów, ale jest mniej przydatna niż inne statystyki opisowe, które można uruchomić osobno przed uruchomieniem regresji Poissona. Najlepsze, co możesz uzyskać z tej tabeli, to zrozumienie, czy w twojej analizie może występować nadmierne rozproszenie (tj. założenie #5 regresji Poissona). Możesz to zrobić rozważając stosunek wariancji (kwadrat kolumny „Odchylenie Std.”) do średniej (kolumna „Średnia”) dla zmiennej zależnej. Możesz zobaczyć te liczby poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Średnia wynosi 2,29 a wariancja 2,81 (1,677582), co daje stosunek 2,81 ÷ 2,29 = 1,23. Rozkład Poissona zakłada, że stosunek wynosi 1 (tzn. średnia i wariancja są równe). Widzimy zatem, że zanim dodamy jakiekolwiek zmienne objaśniające, mamy do czynienia z niewielką naddyspersją. Musimy jednak sprawdzić to założenie, gdy wszystkie zmienne niezależne zostaną dodane do regresji Poissona. Jest to omówione w następnej sekcji.
Określanie, jak dobrze model pasuje
Tablica Goodness of Fit dostarcza wielu miar, które mogą być użyte do oceny, jak dobrze model pasuje. Jednak skoncentrujemy się na wartości w kolumnie „Wartość/df” dla wiersza „Pearson Chi-Square”, która w tym przykładzie wynosi 1,108, jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Wartość 1 wskazuje na równomierne rozproszenie, podczas gdy wartości większe niż 1 wskazują na nadmierne rozproszenie, a wartości poniżej 1 wskazują na niedostateczne rozproszenie. Najczęstszym rodzajem naruszenia założenia o równomiernym rozproszeniu jest nadmierne rozproszenie. Przy tak małej liczebności próby w tym przykładzie wartość 1,108 prawdopodobnie nie będzie poważnym naruszeniem tego założenia.
Tabela Omnibus Test mieści się gdzieś pomiędzy tą sekcją a następną. Jest to test współczynnika prawdopodobieństwa tego, czy wszystkie zmienne niezależne łącznie poprawiają model w stosunku do modelu tylko przechwytującego (tj. bez dodanych zmiennych niezależnych). Mając wszystkie zmienne niezależne w naszym przykładowym modelu, mamy p-value równe .006 (tj., p = .006), wskazujące na statystycznie istotny model ogólny, jak pokazano poniżej w kolumnie „Sig.”:
Publikacja za pisemną zgodą SPSS Statistics, IBM Corporation.
Teraz, gdy wiesz, że dodanie wszystkich zmiennych niezależnych generuje statystycznie istotny model, będziesz chciał wiedzieć, które konkretne zmienne niezależne są statystycznie istotne. Zostało to omówione w następnej sekcji.
Efekty modelu i istotność statystyczna zmiennych niezależnych
W tabeli Testy efektów modelu (jak pokazano poniżej) wyświetlana jest istotność statystyczna każdej ze zmiennych niezależnych w kolumnie „Sig.”:
Publikowane za pisemną zgodą SPSS Statistics, IBM Corporation.
Zazwyczaj nie ma żadnego zainteresowania punktem przecięcia modelu. Widzimy jednak, że doświadczenie pracownika naukowego nie było statystycznie istotne (p = .644), ale liczba godzin przepracowanych w tygodniu była statystycznie istotna (p = .030). Tabela ta jest przydatna głównie dla kategorycznych zmiennych niezależnych, ponieważ jest to jedyna tabela, która uwzględnia całkowity efekt zmiennej kategorycznej, w przeciwieństwie do tabeli Parameter Estimates, jak pokazano poniżej:
Published with written permission from SPSS Statistics, IBM Corporation.
Ta tabela zawiera zarówno oszacowania współczynników (kolumna „B”) regresji Poissona, jak i wykładnicze wartości współczynników (kolumna „Exp(B)”). Zazwyczaj to te ostatnie są bardziej informacyjne. Te wykładnicze wartości mogą być interpretowane na więcej niż jeden sposób i w tym przewodniku pokażemy jeden z nich. Rozważmy, na przykład, liczbę godzin przepracowanych tygodniowo (tj. wiersz „no_of_weekly_hours”). Wartość wykładnicza wynosi 1,044. Oznacza to, że liczba publikacji (tj. licznik zmiennej zależnej) będzie 1,044 razy większa dla każdej dodatkowej godziny przepracowanej w tygodniu. Innym sposobem powiedzenia tego jest to, że istnieje 4,4% wzrost liczby publikacji dla każdej dodatkowej godziny przepracowanej w tygodniu. Podobnej interpretacji można dokonać dla zmiennej kategorycznej.
Przykładając to wszystko do kupy
Można by zapisać wyniki liczby godzin przepracowanych tygodniowo w następujący sposób:
- Ogólne
Regresja Poissona została przeprowadzona w celu przewidzenia liczby publikacji, które pracownik naukowy opublikuje w ciągu ostatnich 12 miesięcy w oparciu o doświadczenie pracownika naukowego i liczbę godzin, które pracownik naukowy spędza tygodniowo pracując nad badaniami. Na każdą dodatkową godzinę przepracowaną tygodniowo nad badaniami, 1,044 (95% CI, 1,004 do 1,085) razy więcej publikacji zostało opublikowanych, co jest wynikiem statystycznie istotnym, p = .030.
.