Revue d'Evidence-Based Medicine
Les bornes de non infériorité
Texte sous la responsabilité de la rédaction francophone
La non infériorité à la mode
Nous avons déjà présenté dans cette rubrique, la technique des études de non infériorité (1). Ces études visent à montrer qu’un (nouveau) médicament n’est pas inférieur (en efficacité) au-delà d’une certaine marge à un autre plus ancien qui sert de référence. Nous avons également analysé plusieurs études basées sur un tel dessin, particulièrement les études concernant les nouveaux anticoagulants oraux. C’est loin d’être le seul domaine concerné : en 2000, PubMed répertoriait 9 publications avec le terme « non-inferior » dans le titre ou l’abstract, en 2010, 260 publications, et ce 8 mars 2013, 1 851 publications.
Une non infériorité reconnue à tort
Nous avons, dans notre précédente explication des études de non infériorité, souligné que les conclusions des auteurs favorables à la non infériorité de certains traitements n’étaient, en fait, pas correctes quand les critères de non infériorité étaient réévalués rigoureusement (2). Une nouvelle publication de Wangge et coll. (3) montre que, dans le domaine des nouveaux anticoagulants en prévention des incidents thromboemboliques post-chirurgie orthopédique majeure, les critères de non infériorité choisis par les auteurs ne correspondent pas toujours à un choix correct et qu’une non infériorité est alors avancée à tort. Tout est question de borne…
Borne out
Une borne de non infériorité représente la borne, ou dit autrement la marge, qu’un traitement ne doit pas franchir en termes de moindre efficacité, par rapport au traitement qui sert de référence. La détermination de cette borne n’est universellement ni précisée ni acceptée. En pratique, pour choisir une borne, une valeur représentant la moitié de la borne de supériorité est généralement choisie, parfois les deux tiers pour que cette borne soit considérée comme notable et cliniquement pertinente (4). La FDA a proposé en 2010 (5) un guide pour les études de non infériorité, visant entre autres une détermination correcte de la borne de non infériorité. Ce guide recommande de déterminer en premier lieu l’efficacité du traitement actif de contrôle versus placebo, valeur nommée M1. M1 est choisie comme l’ampleur d’effet minimale du comparateur actif versus placebo (P), soit la borne la plus « pessimiste » (la plus faible efficacité) de l’intervalle de confiance à 95% de l’ampleur d’effet sommée dans une méta-analyse des études concernant le domaine étudié.
Cette valeur M1 une fois déterminée, il reste à déterminer M2, qui est la proportion de M1 à préserver, la différence la plus large cliniquement acceptable pour le nouveau médicament versus référence. Le projet de guide de la FDA ne fixe pas de règle stricte pour le pourcentage d’effet à préserver lors de l’estimation de la borne M2, tout en choisissant 50% dans un exemple donné. Ce qui est le plus important, c’est de bien déterminer en termes de pertinence clinique, le pourcentage maximal d’efficacité qu’il est acceptable de perdre pour le nouveau traitement par rapport à la référence.
Suivant que l’efficacité du comparateur versus placebo est exprimée en différence de risque (Réduction Absolue de Risque) ou en Risque Relatif (RR), les formules de calcul sont différentes. Le projet de guide ne mentionne pas clairement le meilleur choix entre RAR et RR.
Exemple dans le guide de la FDA Une méta-analyse réalisée par la FDA en 2010 pour les études concernant la warfarine (W) en cas de FA, montre, en analyse en modèle d’effets aléatoires, un risque relatif de 0,361 (IC à 95% de 0,248 à 0,527) pour le critère primaire (AVC, AIT ou embolie systémique) pour la warfarine versus placebo (RR (W/P)). La borne la plus pessimiste de 0,527 représente une réduction de risque de 47%, ce qui peut également être exprimé par une augmentation de risque d’environ 90% pour le placebo versus warfarine (1/0,527 = 1,898 = RR (P/W)). Ce chiffre de 1,898 est notre M1. Il peut être exprimé sous forme logarithmique « naturelle » (pour une distribution plus symétrique) ln 1,898 = 0,641. En choisissant que M2 soit 50% de M1, M2 en ln = 0,641 x 50% = 0,3205. Cette valeur de 0,3205 est retransformée en valeur non logarithmique : e0,3205 = 1,378. Cette borne de non infériorité de 1,378 est à ne pas franchir pour notre RR (X/W). L’étude SPORTIF V avec le ximélagatran (X) montre un risque relatif pour le critère primaire de 1,39 (IC à 95% de 0,91 à 2,12), soit une borne de l’intervalle de confiance de 2,12 dépassant la borne de non-infériorité M2 proposée (1,378). Une non infériorité du ximélagatran versus warfarine n’est donc pas montrée. |
L’hypothèse de concordance (constancy assumption)
Il s’agit dans une étude de non infériorité de déterminer indirectement l’efficacité d’un nouveau médicament versus placebo en comparant ce médicament à une référence qui a montré son efficacité versus placebo.
L’inférence des résultats d’une étude de non infériorité (c’est-à-dire la généralisation des résultats observés sur l’échantillon étudié à la population concernée) repose sur l’hypothèse que l’effet du comparateur dans l’étude de non infériorité est semblable (concordance) à l’effet observé avec ce comparateur versus placebo dans les études qui ont servi à fixer M1. Ceci suppose qu’il n’y ait pas de différences pour les caractéristiques des populations incluses dans les études du médicament de référence versus placebo et l’étude de non infériorité, de différences significatives dans la pratique médicale, dans les traitements concomitants, dans des valeurs de référence (INR cibles par exemple), pour les critères de jugement.
Conclusion
Plusieurs articles, dont celui de Wangge et coll., soulignent les incertitudes liées aux études de non infériorité, notamment dans la détermination de la borne d’infériorité et dans l’hypothèse de concordance avec les études de référence pour déterminer cette borne. Des recommandations internationales rigoureuses et les preuves de l’application de celles-ci pourraient rassurer les cliniciens quant à la validité des conclusions tirées par les auteurs de telles études.
Remerciements à Piet Vancraeynest pour ses commentaires qui ont permis d’améliorer ce texte.
Références
- Chevalier P. Etude de non infériorité : intérêt, limites et pièges. MinervaF 2009;8(7):100.
- Kaul S, Diamond GA. Good enough: a primer on the analysis and interpretation of noninferiority trials. Ann Intern Med 2006;145:62-9.
- Wangge G, Roes K, de Boer A, et al. The challenges of determining noninferiority margins: a case study of noninferiority randomized controlled trials of novel oral anticoagulants. CMAJ 2013;185:222-7.
- Grouin JM et Coste M. Essais de non-infériorité et d’équivalence: méthodologie et analyse. In Essais cliniques : théorie, pratique et critique. Médecine-Sciences Editions Flammarion 2006.
- FDA. Guidance for industry non-inferiority clinical trials.
Ajoutez un commentaire
Commentaires