Analyse


Jugement clinique versus modèles de prédiction statistiques : qui gagne ?


27 06 2024

Professions de santé

Audiologiste, Dentiste, Diététicien, Ergothérapeute, Infirmier, Kinésithérapeute, Logopède, Médecin généraliste, Pharmacien, Podologue, Psychologue, Sage-femme
Analyse de
Colunga-Lozano LE, Foroutan F, Rayner D, et al. Clinical judgment shows similar and sometimes superior discrimination compared to prognostic clinical prediction models: a systematic review. J Clin Epidemiol 2024;165:111200. DOI: 10.1016/j.jclinepi.2023.10.016


Question clinique
Quelle est la performance prédictive des modèles de prédiction statistiques versus jugement clinique des professionnels de la santé ?


Conclusion
Cette étude, de bonne qualité méthodologique mais se basant sur des données hétérogènes et à haut risque de biais, suggère que, de manière générale, la performance pronostique du jugement clinique des professionnels de la santé est aussi bonne que celle des modèles de prédiction clinique.


Contexte

La gestion de l’incertitude diagnostique, thérapeutique et pronostique fait partie des défis majeurs des professionnels de la santé (1-3).  Les outils pronostiques basés sur les modèles de prédiction statistiques (comme, par exemple, le risque SCORE) peuvent aider les soignants à évaluer la probabilité de survenue d’un événement (4). Nous avions déjà, dans Minerva, discuté de l’utilité de certains scores prédictifs, sans pour autant les comparer au jugement clinique (5-8). Nous avions également discuté de l’importante valeur prédictive négative de l’intuition des médecins généralistes (« gut feeling ») dans le diagnostic du cancer et des maladies graves (9,10). Les études ayant confronté la performance de ces outils au jugement clinique ont montré des résultats contrastés et les quelques revues systématiques disponibles se sont limitées essentiellement au secteur des soins critiques (4). Les auteurs de la revue systématique ici présentée se proposent d’étendre cette comparaison à l’ensemble des outils prédictifs et de déterminer si possible les raisons qui expliquent la supériorité de l’une ou de l’autre approche prédictive (4). 

 

 

Résumé 

Méthodologie 

Revue systématique avec analyse quantitative mais non poolée des résultats.

 

Sources consultées

  • Medline via Pubmed, Embase et CINAHL. 

 

Etudes sélectionnées

  • études observationnelles comparant les modèles de prédiction statistiques (MPS) (= modèle de prédiction clinique (MPC)) au jugement clinique
    • sur la même population de patients 
    • sur le même laps de temps
    • et rapportant une ou deux mesures de performance, de discrimination ou de calibration 
    • sans restriction de langue
  • au total, 41 études ont été sélectionnées, publiées entre 1986 et 2022 
    • 8 sont des abstracts de conférences 
    • 27 études monocentriques 
    • suivi de 7 jours à 5 ans. 

 

Population étudiée

  • professionnels de la santé
  • patients hospitalisés et ambulatoires.

 

Mesure des résultats 

  • mesure des résultats primaires
    • caractéristiques du modèle de prédiction clinique (MPC) utilisé ainsi que les performances discriminatives et d’étalonnage (capacité à prédire avec justesse ce qu’il se produit dans la réalité) 
    • performances discriminatives et d’étalonnage du jugement clinique
    • performance comparative du jugement clinique versus MPC
    • performance comparative du jugement clinique seul versus jugement clinique associé à un MPC
  • mesures des résultats secondaires
    • analyses de sous-groupes : 
      • type de population 
      • type de critère de jugement clinique 
      • lieu de prise en charge (hospitalier ou ambulatoire) 
      • type de MPC 
      • type de développement de MPC 
      • type de prestataire 
      • nombre de sites impliqués 
      • taille de l’échantillon 
      • incidence d’événements 
      • performance statistique
  • mesure des résultats primaires : les résultats sont présentés sous forme de courbes ROC avec calcul de l’AUC
  • informations éventuelles sur la valeur ajoutée de l’utilisation du jugement clinique versus MPC
  • mesure du risque de biais des études sélectionnées.

 

Résultats 

  • mesure des résultats primaires
    • performance discriminative globale : 31 études 

 

Type de test

AUC médiane

Ecart interquartile

MPC

0,73

0,62 à 0,81

Jugement clinique

0,71

0,62 à 0,81

 

    • performance discriminative comparative : 156 comparaisons effectuées par les auteurs 
    • MPC versus jugement clinique : 124 comparaisons exploitables (28 études)
      • MPC > jugement clinique :  31 comparaisons (15 études) 
      • jugement clinique > MPC : 35 comparaisons (13 études) 
      • pas de différence significative : 58 comparaisons (16 études) 

 

Type de test

AUC médiane

Dispersion (bornes inférieures et supérieures)

MPC

0,63

0,41 à 0,86

Jugement clinique

0,66

0,59 à 0,77

 

    • jugement clinique versus jugement clinique + MPC : 30 comparaisons exploitables (15 études)
      • MPC + jugement clinique > jugement clinique : 9 études 
      • jugement clinique > MPC + jugement clinique : 1 étude

 

Type de test

AUC médiane

Dispersion (bornes inférieures et supérieures)

Jugement clinique

0,68

0,52 à 0,89

MPC + jugement clinique

0,76

0,52 à 0,88

 

    • performance d’étalonnage : peu d’études disponibles avec données hétérogènes 
    • performance d’étalonnage bonne pour les MPC dans 3 études et pour le jugement clinique dans 1 étude 
    • performance d’étalonnage comparative disponible dans 4 études : MPC > jugement clinique
  • mesure des résultats secondaires
    • analyses de sous-groupes : 
      • jugement clinique pronostique : 
        • supérieur chez les infirmières versus médecins généralistes 
        • supérieur aux urgences versus services de santé mentale 
      • MPC pronostique : 
        • supérieur aux urgences 
        • performance discriminative de qualité et homogène dans toutes les populations  
        • performance discriminative supérieure si le MPC est basé sur du machine-learning versus modèles bayésiens 
      • MPC versus jugement clinique : 
        • MPC > jugement clinique chez les patients chirurgicaux 
        • jugement clinique > MPC chez les patients en soins critiques 
        • jugement clinique = MPC en soins aigus 
      • les incidences d’événements sont faibles (< 100) dans la plupart des études
  • risque de biais : 2 études à faible risque de biais et 39 à haut risque. 

 

Conclusion des auteurs

Les auteurs concluent que le jugement clinique a une performance discriminative au moins aussi valable que les MPC, mais sa performance d’étalonnage est plus faible que ces derniers.

 

Financement de l’étude

Financement par une fondation privée. 

 

Conflits d’intérêt des auteurs

Pas de conflits d’intérêts déclarés. 

 

 

Discussion 

Evaluation de la méthodologie

Cette étude est globalement de bonne qualité méthodologique. Le protocole a été pré-enregistré, les critères d’inclusion et d’exclusion sont clairs, la recherche bibliographique a été effectuée avec un bibliothécaire dans au moins 3 bases de données. Le processus de sélection a été effectué par deux auteurs avec un indice de concordance de 85%. La table d’extraction est claire et adéquate en regard de la question de recherche posée. Les risques de biais ont été correctement évalués à l’aide du Prediction model Risk Of Bias ASsessment Tool (PROBAST). Cependant, plusieurs faiblesses de cette étude sont à discuter. D’une part, le protocole présente de nombreuses imperfections qui interrogent sur la façon dont les analyses ont été traitées : par exemple, le nombre d’études rapportant une information sur la performance d’étalonnage passe de 12 à 13 puis à 14 sur deux paragraphes différents. Ou encore, les auteurs indiquent avoir analysé des études entre 1986 et 2022 puis, quelques pages plus loin, de 1996 à 2022. Ce sont des détails, mais cela questionne la précision des données. Notons que ces nombreuses imperfections et approximations dans le rapportage des résultats contrastent avec la rigueur du protocole présenté. Dès lors, nous interprétons les résultats avec beaucoup de précautions et nous interrogeons l'origine des données présentées.
 

Evaluation sur les résultats

La question posée par cet article est utile pour la pratique. En revanche, l’étude regroupe sous un même vocable de modèle de prédiction clinique (MPC) des outils applicables à des situations cliniques, des environnements de travail très variés (CHA2DS2, score de Glasgow, etc.) ainsi que des prestataires aux compétences, responsabilités et expériences différentes. Les auteurs eux-mêmes reconnaissent l’importante hétérogénéité des études. Ceci rend l’interprétation des résultats difficilement généralisable. En comparaison avec d’autres études, la place du jugement clinique comme outil pronostique valide est néanmoins corroborée (10-14).

 

Que disent les guides de pratique clinique ?

Nous n’avons pas de connaissance de guides de pratique mettant directement en lien les modèles de prédiction clinique (MPC) et le jugement clinique. 

 

 

Conclusion de Minerva

Cette étude, de bonne qualité méthodologique mais se basant sur des données hétérogènes et à haut risque de biais, suggère que, de manière générale, la performance pronostique du jugement clinique des professionnels de la santé est aussi bonne que celle des modèles de prédiction clinique. 

 

 


Références 

  1. Motte B, Aiguier G, Van Pee D, Cobbaut JP. Mieux comprendre l’incertitude en médecine pour former les médecins. Pédagogie médicale 2020;21:39-51. DOI: 10.1051/pmed/2020025
  2. Bloy G. L’incertitude en médecine générale : sources, formes et accommodements possibles. Sciences sociales et santé 2008;26:67. DOI: 10.3917/sss.261.0067
  3. Higgs J, Jensen GM, Loftus S, Christensen N. (eds). Clinical reasoning in the health professions. Fourth edition. Elsevier, 2018.
  4. Colunga-Lozano LE, Foroutan F, Rayner D, et al. Clinical judgment shows similar and sometimes superior discrimination compared to prognostic clinical prediction models: a systematic review. J Clin Epidemiol 2024;165:111200. DOI: 10.1016/j.jclinepi.2023.10.016
  5. Henrard G.  Cet enfant a-t-il une appendicite ? MinervaF 2013;12(5):60-1.
  6. Kulik DM, Uleryk EM, Maguire JL. Does this child have appendicitis? A systematic review of clinical prediction rules for children with acute abdominal pain. J Clin Epidemiol 2013;66:95-104. DOI: 10.1016/j.jclinepi.2012.09.004
  7. Van Meerhaeghe A. Utilité d’un modèle prédictif pour un diagnostic plus précoce du cancer du poumon ? MinervaF 2013;12(9):112-3
  8. Iyen-Omofoman B, Tata LJ, Baldwin DR, et al. Using socio-demographic and early clinical features in general practice to identify people with lung cancer earlier. Thorax 2013;68:451-9. DOI: 10.1136/thoraxjnl-2012-202348
  9. Joly L. Quelle est la valeur diagnostique de l’intuition clinique des médecins généralistes dans la détection des cancers et des maladies graves ? MinervaF 2023;22(9):215-9.
  10. Oliva-Fanlo B, March S, Gadea-Ruiz C, et al; CORap group. Prospective observational study on the prevalence and diagnostic value of general practitioners’ gut feelings for cancer and serious diseases. J Gen Intern Med 2022;37:3823-31. DOI: 10.1007/s11606-021-07352-w
  11. Donker GA, Wiersma E, van der Hoek L, Heins M. Determinants of general practitioner’s cancer-related gut feelings - a prospective cohort study. BMJ Open 2016;6:e012511. DOI: 10.1136/bmjopen-2016-012511
  12. Hartley MN, Sagar PM. The surgeon’s “gut feeling” as a predictor of post-operative outcome. Ann R Coll Surg Engl 1994;76(6 Suppl):277-8.
  13. Oliva-Fanlo B, March S, Medina D, et al. Prevalence and diagnostic value of GPs’ gut feelings for cancer and serious diseases: protocol for a prospective observational study of diagnostic validity. BMJ Open 2019;9:e032404. DOI: 10.1136/bmjopen-2019-032404
  14. Van den Bruel A, Thompson M, Buntinx F, Mant D. Clinicians’ gut feeling about serious infections in children: observational study. BMJ 2012;345:e6144-e6144. DOI: 10.1136/bmj.e6144
     

 


Auteurs

Joly L.
médecin généraliste, ULiège
COI : Absence de conflits d’intérêt avec le sujet.

Glossaire

Code



A99


Ajoutez un commentaire

Commentaires