The ecological fallacy strikes back | Journal of Epidemiology & Community Health

Lorsque j’ai commencé à étudier l’épidémiologie, les études écologiques étaient brièvement évoquées comme une méthode peu coûteuse mais peu fiable pour étudier les facteurs de risque de maladie au niveau individuel. Par exemple, plutôt que de consacrer du temps et de l’argent à la mise en place d’une étude de cohorte ou d’une étude cas-témoins sur la consommation de graisses et le cancer du sein, vous pouviez simplement utiliser les données nationales sur l’alimentation et l’incidence du cancer et, avec un minimum de temps et de dépenses, montrer une forte corrélation au niveau international entre la consommation de graisses et le cancer du sein. Cette approche a été considérée, à juste titre, comme inadéquate et peu fiable en raison des nombreuses formes supplémentaires de biais qui peuvent apparaître dans de telles études par rapport aux études portant sur des individus au sein d’une population. En particulier, le « sophisme écologique » peut se produire dans la mesure où les facteurs qui sont associés aux taux de maladie nationaux peuvent ne pas être associés à la maladie chez les individus1. Par exemple, presque toutes les maladies qui sont associées à la richesse et à l’occidentalisation ont été associées dans le passé au niveau national aux ventes de téléviseurs, et aujourd’hui sont probablement associées au niveau national aux taux d’utilisation d’Internet.

Donc, les études écologiques n’étaient pas une bonne chose à faire, et étaient une relique de la phase « pré-moderne » de l’épidémiologie avant qu’elle ne soit fermement établie avec un paradigme méthodologique basé sur la théorie des essais contrôlés randomisés sur des individus. Ce paradigme, qui est très puissant lorsqu’il est utilisé de manière appropriée, a donné lieu à des méthodes de plus en plus sophistiquées de conception des études et d’analyse des données. En particulier, les méthodes biostatistiques développées pour les essais randomisés impliquant une exposition au niveau d’un seul individu ont été utilisées pour reformuler et rendre plus rigoureuses les méthodes épidémiologiques ad hoc de conception d’études et d’analyse de données.23 Ainsi, les cours d’épidémiologie se limitent de plus en plus à discuter des études de cohorte et de cas-témoins et des méthodes d’analyse de données qui correspondent au paradigme des essais cliniques sur lequel ils sont basés. Il n’y a généralement que peu ou pas de discussion sur la philosophie des sciences (à l’exception de quelques versions poppériennes très simplistes), ou sur la manière dont les théories et les hypothèses sont développées. Les étudiants en épidémiologie obtiennent ensuite leur diplôme et partent dans le « monde réel » pour tester les hypothèses qui peuvent être étudiées à l’aide de ces méthodes et pour lesquelles un financement peut être obtenu.

Maintenant, les études au niveau de la population sont de retour dans les affaires, pour deux raisons importantes.

Premièrement, il est de plus en plus reconnu que, même en étudiant les facteurs de risque au niveau individuel, les études au niveau de la population jouent un rôle essentiel dans la définition des problèmes de santé publique les plus importants à aborder, et dans la génération d’hypothèses quant à leurs causes potentielles. De nombreux facteurs de risque de maladie importants au niveau individuel ne varient tout simplement pas assez au sein des populations pour que leurs effets puissent être identifiés ou étudiés.4 Plus important encore, ces études sont un élément clé du cycle continu de génération et de vérification de théories et d’hypothèses.5 Historiquement, le domaine clé dans lequel les épidémiologistes ont été en mesure d’apporter une « valeur ajoutée » a été cette concentration sur la population, bien que cette leçon ait été oubliée par de nombreux épidémiologistes modernes. Par exemple, bon nombre des découvertes récentes sur les causes du cancer (y compris les facteurs alimentaires et le cancer du côlon, l’hépatite B et le cancer du foie, les aflatoxines et le cancer du foie, le virus du papillome humain et le cancer du col de l’utérus) trouvent leur origine, directement ou indirectement, dans les comparaisons internationales systématiques de l’incidence du cancer effectuées dans les années 1950 et 1960.6 Ces comparaisons ont permis de formuler des hypothèses sur les causes possibles des tendances internationales, qui ont été approfondies dans des études ultérieures. Dans certains cas, ces hypothèses correspondaient aux connaissances biologiques de l’époque, mais dans d’autres, elles étaient nouvelles et frappantes et n’auraient peut-être pas été proposées ou étudiées plus avant si les analyses au niveau de la population n’avaient pas été effectuées. Plus récemment, des fonds considérables ont été consacrés à l’étude des causes « connues » de l’asthme dans les pays riches (par exemple, la pollution atmosphérique, l’exposition aux allergènes), et ce n’est que maintenant que des études standardisées révèlent des différences internationales majeures dans la prévalence de l’asthme qui ne s’expliquent pas par ces facteurs de risque « établis » tels que la pollution atmosphérique7, mais qui sont plus conformes aux théories récentes sur le rôle protecteur de certaines infections infantiles dans l’étiologie de l’asthme8.

Une deuxième raison pour laquelle les études écologiques sont de retour est qu’il est de plus en plus reconnu que certains facteurs de risque de maladie opèrent véritablement au niveau de la population9-11. Dans certains cas, ils peuvent causer directement la maladie, mais peut-être plus couramment, ils peuvent causer la maladie en tant que modificateurs d’effet ou déterminants de l’exposition aux facteurs de risque au niveau individuel.12 Par exemple, être pauvre dans un pays ou un quartier riche peut être pire que d’avoir le même niveau de revenu dans un pays ou un quartier pauvre, en raison des problèmes d’exclusion sociale et du manque d’accès aux services et aux ressources.13 Cela peut fonctionner par des mécanismes relativement directs, mais peut également impliquer des aspects du mode de vie individuel qui sont en partie déterminés par le contexte social. Par exemple, la décision de continuer à obtenir un soulagement et un plaisir temporaires en fumant du tabac peut être tout à fait rationnelle pour quelqu’un qui survit de semaine en semaine dans des circonstances difficiles.

L’absence de prise en compte de l’importance du contexte de la population, en tant que modificateur d’effet et déterminant des expositions au niveau individuel pourrait être qualifiée de « sophisme individualiste « 14 dans lequel les principaux déterminants de la santé au niveau de la population sont ignorés et une attention excessive est portée sur les caractéristiques individuelles. Dans cette situation, les associations entre ces caractéristiques individuelles et la santé peuvent être valablement estimées, mais leur importance par rapport à d’autres interventions potentielles, et l’importance du contexte de ces interventions, peuvent être ignorées. Par exemple, dans la plupart des pays du monde, toute étude au niveau individuel identifiera certaines caractéristiques individuelles (y compris les facteurs génétiques) qui semblent être les déterminants les plus importants de la santé. Cependant, les événements récents en Europe de l’Est ont montré que ces caractéristiques individuelles opèrent dans un contexte de population puissant qui peut être un déterminant beaucoup plus fort de la maladie au niveau de la population.15 Ignorer ce contexte et tenter d’étudier des populations homogènes peut conduire à la conclusion erronée que les caractéristiques individuelles sont les principaux déterminants de la maladie et les plus importants pour l’intervention, tout comme étudier des populations aux modes de vie homogènes peut conduire à la conclusion erronée que d’autres facteurs sont les principaux déterminants de la maladie.4

Ces considérations ont conduit à un renouveau des études au niveau de la population ces dernières années, avec un intérêt croissant pour les méthodes statistiques d’analyse multi-niveaux. Celles-ci ont des mérites considérables car elles permettent d’estimer les effets (écologiques) au niveau de la population tout en incluant les effets au niveau individuel16, évitant ainsi le sophisme écologique et le sophisme individualiste. Cependant, bien que l’analyse statistique de ces études ait fait l’objet de nombreuses discussions, les autres questions méthodologiques liées à l’étude des véritables effets écologiques ont été relativement peu abordées. L’article de Blakely et Woodward dans ce numéro de la revue est donc une contribution très opportune et précieuse. En particulier, ils font part de leur inquiétude quant au fait que « l’application des méthodes statistiques multiniveaux a peut-être pris le pas sur un cadre théorique permettant de mener des analyses significatives et solides » et qu' »à mesure que les chercheurs dépassent l’exaltation initiale de l’application de la « magie » des méthodes statistiques multiniveaux aux données, ils doivent se concentrer de plus en plus sur la théorie, la conception des études et les sources d’erreur ». Tout comme l’apprentissage de la méthode de Mantel-Haenszel ou de la régression logistique standard n’est qu’une petite partie de l’apprentissage de l’épidémiologie, l’apprentissage de la régression logistique multiniveau n’est qu’une petite partie de l’apprentissage de l’épidémiologie multiniveau. Dans les deux cas, les méthodes biostatistiques ne sont qu’une partie de la boîte à outils épidémiologique, qui comprend des méthodes de conception d’études appropriées, y compris l’évitement, la minimisation ou l’évaluation des biais possibles. Plus important encore, dans les deux cas, la connaissance des méthodes appropriées de conception d’étude et d’analyse des données ne remplace pas le fait de savoir comment choisir l’hypothèse la plus appropriée à étudier.

Alors, comment les épidémiologistes peuvent-ils apprendre à penser de manière multi-niveaux ? Comment peuvent-ils s’assurer que les meilleures hypothèses sont développées pour être étudiées, et que la « technologie appropriée » (que ce soit au niveau de l’individu ou de la population) est ensuite utilisée pour les tester ? Comment les étudiants en épidémiologie peuvent-ils apprendre ces méthodes de manière à pouvoir les utiliser de façon appropriée, plutôt que de laisser les méthodes qu’ils apprennent définir et restreindre les questions qu’ils poseront par la suite ? Deux principes issus de l’enseignement et de la pratique cliniques peuvent être particulièrement pertinents à cet égard.

Premièrement, une approche de l’enseignement de la médecine clinique basée sur les problèmes a été de plus en plus adoptée dans les écoles de médecine du monde entier. La valeur de cette approche est que les théories et les méthodes sont enseignées dans le contexte de la résolution de problèmes de la vie réelle. Cela permet de replacer les méthodes dans leur contexte et de s’assurer que les méthodes appropriées sont choisies en fonction du problème, plutôt que d’adapter le problème aux méthodes. L’enseignement de l’épidémiologie fondée sur les problèmes peut peut-être contribuer à rétablir le lien avec la santé publique et avec le monde réel dans lequel la plupart des problèmes de santé publique impliquent divers niveaux de causalité de la maladie. L’étude de véritables problèmes de santé publique dans leur contexte historique et social n’exclut pas l’apprentissage de méthodes sophistiquées de conception d’études et d’analyse de données (en fait, elle le nécessite), mais elle peut contribuer à garantir que les questions appropriées sont posées et que la « technologie appropriée » est ensuite utilisée pour y répondre.

Deuxièmement, la décision quant à ce qu’est la « technologie appropriée » devrait être fondée sur des preuves. Cela est moins évident qu’il n’y paraît, car de nombreuses méthodes épidémiologiques ne sont pas fondées sur des preuves. Par exemple, la vague actuelle d’enthousiasme pour l' »épidémiologie moléculaire » a conduit à l’utilisation généralisée de biomarqueurs d’exposition, même si leur validité n’est que très peu prouvée. La nécessité d’une épidémiologie fondée sur des preuves s’applique également à la « stratégie de recherche » générale utilisée par les épidémiologistes, ainsi qu’aux méthodes de recherche spécifiques utilisées, car il existe de bonnes preuves historiques de la valeur d’une approche basée sur la population.5

Dans certains cas, l’utilisation de ces nouvelles méthodes rendra l’épidémiologie plus compliquée. Ceci est noté de manière quelque peu désobligeante par Poole et Rothman17 qui semblent assimiler les critiques de l' »épidémiologie moderne » à ceux qui préféreraient un retour aux méthodes « plus simples » et plus ad hoc du passé. Cependant, la question n’est pas de savoir si l’utilisation de méthodes statistiques sophistiquées est souhaitable ou indésirable en soi. Il s’agit plutôt de répondre aux questions scientifiques et de santé publique les plus importantes et d’utiliser la « technologie appropriée » pour y répondre. Dans certains cas, l’approche populationnelle produira des hypothèses qui pourront être étudiées au moyen d’études de cohorte ou de cas-témoins simples et analysées à l’aide de tableaux 2 × 2 ou des méthodes multivariées correspondantes de régression de Poisson ou logistique. Dans d’autres cas, des méthodes très différentes de conception d’étude et d’analyse des données peuvent être nécessaires.11

Dans chaque cas, l’épidémiologie continuera à impliquer une collaboration saine entre les épidémiologistes et les biostatisticiens (ainsi que les biologistes, les spécialistes des sciences sociales et autres), mais ce sont les épidémiologistes qui ont la responsabilité première d’identifier et de développer les questions de recherche les plus importantes au niveau de la population, qui peuvent ensuite être étudiées à l’aide de méthodes biostatistiques appropriées. L’article de Blakely et Woodward est une contribution importante à cet égard, car il nous alerte sur les dangers d’ajouter simplement la modélisation multiniveau à notre boîte à outils analytique, et soulève les questions importantes de développement de la théorie, de conception de l’étude et d’évaluation du biais qui doivent être prises en compte dans les études multiniveau, tout comme elles le sont actuellement (ou devraient l’être) dans les études au niveau individuel.

Remerciements

Je souhaite remercier Ichiro Kawachi et Tony McMichael pour leurs commentaires sur le projet de manuscrit.

Financement : Le professeur Pearce est financé par une subvention de programme du Conseil de recherche en santé de la Nouvelle-Zélande.

    1. Greenland S,
    2. Robins J

    (1994) Études écologiques-biais, idées fausses et contre-exemples. Am J Epidemiol 139:747-760.

    1. Miettinen OS

    (1985) Theoretical epidemiology : principles of occurrence research. (Wiley, New York).

    1. Rothman KJ,
    2. Greenland S

    (1998) Modern epidemiology. (Lippincott-Raven, Philadelphie), 2e éd.

    1. Rose G

    (1992) La stratégie de la médecine préventive. (Oxford University Press, Oxford).

    1. Pearce N

    (1999) L’épidémiologie comme science de la population. Int J Epidemiol 28:S1015-S1018.

    1. Doll R,
    2. Payne P,
    3. Waterhouse J

    , eds (1966) Cancer incidence in five continents : a technical report. (Springer-Verlag (pour l’UICC) Berlin).

    1. Comité directeur de l’ISAAC (Comité de rédaction : Beasley R, Keil U, Von Mutius E, Pearce N)

    (1998) Variation mondiale de la prévalence des symptômes de l’asthme, de la rhinoconjonctivite allergique et de l’eczéma atopique : ISAAC. Lancet 351:1225-1232.

  1. Von Mutius E, Pearce N, Beasley R, et al, au nom du comité directeur de l’ISAAC. Schémas internationaux de la tuberculose et de la prévalence des symptômes de l’asthme, de la rhinite et de l’eczéma. Thorax (sous presse)..

    1. Susser M

    (1994a) La logique dans l’écologique : I. La logique de l’analyse. Am J Public Health 84:825-829.

    1. Susser M

    (1994b) La logique en écologique : II. La logique de la conception. Am J Public Health 84:825-829.

    1. McMichael AJ

    (1999) Prisonniers du proche : desserrer les contraintes de l’épidémiologie dans une ère de changement. Am J Epidemiol 149:887-897.

    1. Kunitz S

    (1994) Maladie et diversité sociale. (Oxford University Press, New York).

    1. Yen IH,
    2. Kaplan GA

    (1999) Environnement social du voisinage et risque de décès : preuves multi-niveaux de l’étude du comté d’Alameda. Am J Epidemiol 149:898-907.

    1. Diez-Roux AV

    (1998) Bringing context back into epidemiology : variables and fallacies in multilevel analysis. Am J Public Health 88:216-222.

    1. Bobak M,
    2. Marmot M

    (1996) East-West mortality divide and its potential explanations : proposed research agenda. BMJ 312:421-425.

    1. Blakeley TA,
    2. Woodward AJ

    (2000) Effets écologiques dans les études à plusieurs niveaux. J Epidemiol Community Health 54:367-374.

    1. Poole C,
    2. Rothman KJ

    (1998) Notre objection de conscience aux guerres de l’épidémiologie. J Epidemiol Community Health 52:613-614.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.