The ecological fallacy strikes back | Journal of Epidemiology & Community Health

Quando ho iniziato a studiare epidemiologia, gli studi ecologici sono stati brevemente discussi come un metodo poco costoso ma inaffidabile per studiare i fattori di rischio a livello individuale per la malattia. Per esempio, piuttosto che andare a tempo e spese per stabilire uno studio di coorte o uno studio caso-controllo di assunzione di grassi e cancro al seno, si potrebbe semplicemente utilizzare i dati nazionali di incidenza della dieta e del cancro e, con tempo e spese minime, mostrare una forte correlazione a livello internazionale tra assunzione di grassi e cancro al seno. Questo approccio è stato giustamente considerato inadeguato e inaffidabile a causa delle molte forme aggiuntive di bias che possono verificarsi in tali studi rispetto agli studi di individui all’interno di una popolazione. In particolare, la “fallacia ecologica” può verificarsi in quanto i fattori che sono associati con i tassi di malattia nazionale può non essere associato con la malattia in individui.1 Per esempio, quasi tutte le malattie associate al benessere e all’occidentalizzazione sono state associate in passato a livello nazionale con le vendite di televisori, e oggi sono probabilmente associate a livello nazionale con i tassi di utilizzo di internet.

Quindi, gli studi ecologici non erano una buona cosa da fare, ed erano una reliquia della fase “pre-moderna” dell’epidemiologia prima che si affermasse saldamente con un paradigma metodologico basato sulla teoria degli studi controllati randomizzati sugli individui. Questo paradigma, molto potente se usato in modo appropriato, ha dato origine a metodi sempre più sofisticati di disegno degli studi e di analisi dei dati. In particolare, i metodi biostatistici che sono stati sviluppati per gli studi randomizzati che coinvolgono una singola esposizione a livello individuale sono stati utilizzati per riformulare e rendere più rigorosi i metodi epidemiologici ad hoc del disegno dello studio e dell’analisi dei dati.23 Così, i corsi di epidemiologia si sono sempre più limitati a discutere gli studi di coorte e caso-controllo e i metodi di analisi dei dati che si adattano al paradigma dello studio clinico su cui sono basati. Di solito c’è poca o nessuna discussione sulla filosofia della scienza (con l’eccezione di alcune versioni popperiane molto semplicistiche), o su come si sviluppano teorie e ipotesi. Gli studenti di epidemiologia poi si laureano e vanno nel “mondo reale” per testare le ipotesi che possono essere studiate con questi metodi e per le quali si possono ottenere finanziamenti.

Ora gli studi a livello di popolazione sono tornati in attività, per due importanti ragioni.

In primo luogo, è sempre più riconosciuto che, anche quando si studiano i fattori di rischio a livello individuale, gli studi a livello di popolazione svolgono un ruolo essenziale nel definire i più importanti problemi di salute pubblica da affrontare, e nel generare ipotesi sulle loro potenziali cause. Molti importanti fattori di rischio di malattia a livello individuale semplicemente non variano abbastanza all’interno delle popolazioni per consentire l’identificazione o lo studio dei loro effetti.4 Ancora più importante, tali studi sono una componente chiave del ciclo continuo di generazione e verifica di teorie e ipotesi.5 Storicamente, l’area chiave in cui gli epidemiologi sono stati in grado di “aggiungere valore” è stata attraverso questo focus sulla popolazione, sebbene questa lezione sia stata dimenticata da molti epidemiologi moderni. Per esempio, molte delle recenti scoperte sulle cause del cancro (inclusi i fattori dietetici e il cancro al colon, l’epatite B e il cancro al fegato, le aflatossine e il cancro al fegato, il papilloma virus umano e il cancro al collo dell’utero) hanno avuto origine, direttamente o indirettamente, dai confronti sistematici internazionali dell’incidenza del cancro condotti negli anni ’50 e ‘60.6 Questi hanno suggerito ipotesi sulle possibili cause dei modelli internazionali, che sono state approfondite in ulteriori studi. In alcuni casi queste ipotesi erano coerenti con le conoscenze biologiche dell’epoca, ma in altri casi erano nuove e sorprendenti, e non sarebbero state proposte o indagate ulteriormente se le analisi a livello di popolazione non fossero state fatte. Più recentemente, un’enorme quantità di fondi è stata spesa per studiare le cause “note” dell’asma nei paesi ricchi (per esempio, l’inquinamento atmosferico, l’esposizione agli allergeni), e solo ora gli studi standardizzati stanno rivelando importanti differenze internazionali nella prevalenza dell’asma che non sono spiegate da questi fattori di rischio “stabiliti” come l’inquinamento atmosferico7 , ma sono più coerenti con le recenti teorie sul ruolo protettivo di alcune infezioni infantili nell’eziologia dell’asma8 .

Un secondo motivo per cui gli studi ecologici sono tornati è che viene sempre più riconosciuto che alcuni fattori di rischio per le malattie operano realmente a livello di popolazione.9-11 In alcuni casi possono causare direttamente la malattia, ma forse più comunemente possono causare la malattia come modificatori di effetti o determinanti dell’esposizione a fattori di rischio a livello individuale.12 Per esempio, essere poveri in un paese o in un quartiere ricco può essere peggio che avere lo stesso livello di reddito in un paese o in un quartiere povero, a causa di problemi di esclusione sociale e mancanza di accesso a servizi e risorse.13 Questo può operare attraverso meccanismi relativamente diretti, ma può anche coinvolgere aspetti dello stile di vita individuale che sono in parte determinati dal contesto sociale. Per esempio, la decisione di continuare ad ottenere un sollievo temporaneo e il piacere attraverso il fumo di tabacco può essere abbastanza razionale per qualcuno che sta sopravvivendo di settimana in settimana in circostanze difficili.

La mancata considerazione dell’importanza del contesto della popolazione, come modificatore di effetti e determinante delle esposizioni a livello individuale potrebbe essere definita la “fallacia individualistica “14 in cui i principali determinanti della popolazione della salute vengono ignorati e l’attenzione eccessiva si concentra sulle caratteristiche individuali. In questa situazione, le associazioni tra queste caratteristiche individuali e la salute possono essere validamente stimate, ma la loro importanza rispetto ad altri potenziali interventi, e l’importanza del contesto di tali interventi, può essere ignorata. Per esempio, nella maggior parte dei paesi del mondo, qualsiasi studio a livello individuale identificherà alcune caratteristiche individuali (compresi i fattori genetici) che sembrano essere i più importanti determinanti della salute. Tuttavia, eventi recenti nell’Europa dell’Est hanno dimostrato che queste caratteristiche individuali operano all’interno di un potente contesto di popolazione che può essere un determinante molto più forte della malattia a livello di popolazione.15 Ignorare questo contesto e tentare di studiare popolazioni omogenee può portare all’errata conclusione che le caratteristiche individuali siano i principali determinanti della malattia e i più importanti per l’intervento, così come studiare popolazioni con stili di vita omogenei può portare all’errata conclusione che altri fattori siano i principali determinanti della malattia.4

Queste considerazioni hanno portato negli ultimi anni a un revival degli studi a livello di popolazione, con un crescente interesse per i metodi statistici di analisi multilivello. Questi hanno notevoli meriti in quanto permettono di stimare gli effetti a livello di popolazione (ecologici) includendo anche gli effetti a livello individuale,16 evitando così sia la fallacia ecologica che quella individualistica. Tuttavia, sebbene si sia discusso molto dell’analisi statistica di questi studi, si è discusso relativamente poco delle altre questioni metodologiche coinvolte nello studio dei veri effetti ecologici. L’articolo di Blakely e Woodward in questo numero della rivista è quindi un contributo molto tempestivo e prezioso. In particolare, essi notano la loro preoccupazione che “l’applicazione dei metodi statistici multilivello possa aver superato un quadro teorico in cui condurre analisi significative e robuste” e che “man mano che i ricercatori vanno oltre l’euforia iniziale di applicare la ‘magia’ dei metodi statistici multilivello ai dati, ci sarà una crescente e necessaria attenzione alla teoria, al disegno dello studio e alle fonti di errore”. Proprio come imparare a usare il metodo Mantel-Haenszel o la regressione logistica standard è solo una piccola parte dell’apprendimento per essere un epidemiologo, imparare a fare la regressione logistica multilivello è solo una piccola parte dell’apprendimento per essere un epidemiologo multilivello. In entrambi i casi, i metodi biostatistici sono solo una parte del toolkit epidemiologico, che include metodi di disegno di studio appropriato, tra cui evitare, minimizzare o valutare i possibili bias. Ancora più importante, in entrambi i casi, la conoscenza di metodi appropriati di disegno dello studio e di analisi dei dati non sostituisce il sapere come scegliere l’ipotesi più appropriata da studiare.

Come possono dunque gli epidemiologi imparare a pensare in modo multilivello? Come possono assicurarsi che le migliori ipotesi siano sviluppate per lo studio, e che la “tecnologia appropriata” (a livello individuale o di popolazione) sia poi utilizzata per testarle? Come possono gli studenti di epidemiologia imparare questi metodi in modo tale da poterli usare in modo appropriato, piuttosto che lasciare che i metodi che imparano definiscano e limitino le domande che successivamente pongono? Ci sono due principi dell’insegnamento e della pratica clinica che possono essere particolarmente rilevanti a questo proposito.

In primo luogo, un approccio all’insegnamento della medicina clinica basato sui problemi è stato sempre più adottato nelle scuole di medicina di tutto il mondo. Il valore di questo approccio è che le teorie e i metodi vengono insegnati nel contesto della risoluzione di problemi della vita reale. Questo colloca i metodi nel contesto e aiuta a garantire che i metodi appropriati siano scelti per adattarsi al problema, piuttosto che far sì che il problema si adatti ai metodi. Forse l’insegnamento dell’epidemiologia basata sul problema può aiutare a ristabilire il legame con la salute pubblica, e con il mondo reale in cui la maggior parte dei problemi di salute pubblica coinvolge una varietà di livelli di causalità della malattia. Studiare problemi reali di salute pubblica nel loro contesto storico e sociale non esclude l’apprendimento di metodi sofisticati di progettazione di studi e di analisi dei dati (in effetti, ne ha bisogno), ma può aiutare a garantire che vengano poste le domande appropriate e che venga poi utilizzata la “tecnologia appropriata” per rispondervi.

In secondo luogo, la decisione su quale sia la “tecnologia appropriata” dovrebbe essere basata sulle prove. Questo è meno ovvio di quanto sembri, poiché molti metodi epidemiologici non sono basati sull’evidenza. Per esempio, l’attuale ondata di entusiasmo per l'”epidemiologia molecolare” ha portato all’uso diffuso di biomarcatori di esposizione anche quando ci sono poche prove della loro validità. La necessità di un’epidemiologia basata sull’evidenza si applica anche alla “strategia di ricerca” generale che viene utilizzata dagli epidemiologi, così come ai metodi di ricerca specifici che vengono utilizzati, poiché ci sono buone prove storiche del valore di un approccio basato sulla popolazione.5

In alcuni casi l’uso di questi nuovi metodi renderà l’epidemiologia più complicata. Questo è notato in modo un po’ sprezzante da Poole e Rothman17 che sembrano equiparare i critici della “moderna epidemiologia” a coloro che preferirebbero un ritorno ai “più semplici” metodi ad hoc del passato. Tuttavia, la questione qui non è che l’uso di metodi statistici sofisticati sia desiderabile o indesiderabile in sé. Piuttosto, la questione è che dovremmo rispondere alle domande scientifiche e di salute pubblica più importanti e dovremmo usare la “tecnologia appropriata” per rispondere. In alcuni casi, l’approccio della popolazione produrrà ipotesi che possono essere studiate con semplici studi di coorte o caso-controllo e analizzate utilizzando semplici tabelle 2 × 2, o i corrispondenti metodi multivariati di Poisson o regressione logistica. In altri casi, possono essere richiesti metodi molto diversi di progettazione dello studio e di analisi dei dati.11

In ogni caso, l’epidemiologia continuerà a coinvolgere una sana collaborazione tra epidemiologi e biostatistici (così come biologi, scienziati sociali e altri), ma sono gli epidemiologi che hanno la responsabilità primaria di identificare e sviluppare le domande di ricerca più importanti a livello di popolazione, che possono poi essere studiate usando metodi biostatistici appropriati. L’articolo di Blakely e Woodward è un contributo importante a questo proposito, in quanto ci mette in guardia dai pericoli di aggiungere semplicemente la modellazione multilivello al nostro toolkit analitico, e solleva le importanti questioni dello sviluppo della teoria, del disegno dello studio e della valutazione dei bias che devono essere considerati negli studi multilivello, proprio come attualmente sono (o dovrebbero essere) considerati negli studi a livello individuale.

Riconoscimenti

Vorrei ringraziare Ichiro Kawachi e Tony McMichael per i loro commenti sulla bozza del manoscritto.

Finanziamento: Il professor Pearce è finanziato da un Programme Grant dell’Health Research Council of New Zealand.

    1. Greenland S,
    2. Robins J

    (1994) Ecologic studies-biases, misconceptions, and counterexamples. Am J Epidemiol 139:747-760.

    1. Miettinen OS

    (1985) Theoretical epidemiology: principles of occurrence research. (Wiley, New York).

    1. Rothman KJ,
    2. Greenland S

    (1998) Epidemiologia moderna. (Lippincott-Raven, Philadelphia), 2a ed..

    1. Rose G

    (1992) La strategia della medicina preventiva. (Oxford University Press, Oxford).

    1. Pearce N

    (1999) Epidemiologia come scienza della popolazione. Int J Epidemiol 28:S1015-S1018.

    1. Doll R,
    2. Payne P,
    3. Waterhouse J

    , eds (1966) Cancer incidence in five continents: a technical report. (Springer-Verlag (per UICC) Berlino).

    1. ISAAC Steering Committee (Writing Committee: Beasley R, Keil U, Von Mutius E, Pearce N)

    (1998) Worldwide variation in prevalence of symptoms of asthma, allergic rhinoconjunctivitis and atopic eczema: ISAAC. Lancet 351:1225-1232.

  1. Von Mutius E, Pearce N, Beasley R, et al, a nome del comitato direttivo ISAAC. Modelli internazionali di tubercolosi e la prevalenza dei sintomi di asma, rinite ed eczema. Thorax (in press)..

    1. Susser M

    (1994a) La logica in ecologia: I. La logica di analisi. Am J Public Health 84:825-829.

    1. Susser M

    (1994b) La logica ecologica: II. La logica del design. Am J Public Health 84:825-829.

    1. McMichael AJ

    (1999) Prisoners of the proximate: looseing the constraints on epidemiology in an age of change. Am J Epidemiol 149:887-897.

    1. Kunitz S

    (1994) Disease and social diversity. (Oxford University Press, New York).

    1. Yen IH,
    2. Kaplan GA

    (1999) Neighbourhood social environment and risk of death: multilevel evidence from the Alameda County Study. Am J Epidemiol 149:898-907.

    1. Diez-Roux AV

    (1998) Riportare il contesto in epidemiologia: variabili e fallacie nell’analisi multilivello. Am J Public Health 88:216-222.

    1. Bobak M,
    2. Marmot M

    (1996) East-West mortality divide and its potential explanations: proposed research agenda. BMJ 312:421-425.

    1. Blakeley TA,
    2. Woodward AJ

    (2000) Effetti ecologici in studi multilivello. J Epidemiol Community Health 54:367-374.

    1. Poole C,
    2. Rothman KJ

    (1998) La nostra obiezione di coscienza alle guerre epidemiologiche. J Epidemiol Community Health 52:613-614.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.