Tijdschrift voor Evidence-Based Medicine
C statistiek
Tekst onder de verantwoordelijkheid van de Franstalige redactie
Minerva publiceerde twee duidingen waarin de resultaten van analyses op basis van de C statistiek zijn weergegeven. In de duiding over de diagnostische waarde van BNP-bepaling versus ECG of RX-thorax als aanvulling bij de diagnose van hartfalen op basis van de klinische gegevens, zijn de resultaten van de C statisiek duidelijk weergegeven (1,2). In de duiding van een cohortstudie over de prognostische waarde van het inspanningselectrocardiogram bij vermoeden van angor, gebeurde dit iets minder gedetailleerd (3,4). Op basis van deze twee studies verduidelijken we in dit artikel het concept C statistiek. |
Een analyse op basis van de C statistiek is een analyse van de discriminerende waarde van een test, namelijk het vermogen van de test om, ten opzichte van louter toeval, een onderscheid te kunnen maken tussen gezonde en zieke personen of om een onderscheid te kunnen maken tussen hoog- en laagrisicopersonen.
Voor binaire uitkomsten komt de C statistiek overeen met het gebied onder de curve (‘area under the curve’ of AUC) van de ROC-curve (Receiver Operating Characteristic). Op de y-as is de sensitiviteit (terecht positieven) weergegeven aan de hand van verschillende drempelwaarden van de binaire uitkomst (zie figuur 1). Op de x-as bevinden zich de vals-positieven (1-specificiteit). De meest optimale waarde bevindt zich in de linkerbovenhoek van de grafiek en geeft een hoog aantal terecht-positieven en een laag aantal fout-positieven aan.
Figuur 1. Roc-curve
Een ROC-curve is ook toepasselijk voor de onderlinge vergelijking van verschillende diagnostische testen. Dat is het geval in de twee bovenvermelde diagnostische/prognostische studies die we besproken hebben in Minerva.
Het gebied onder de curve wijst op de accuraatheid van de test: 1 is een perfecte test die alle zieken kan detecteren zonder fout-positieven (verticale rechte links op de grafiek) en 0,5 is een waardeloze test (komt overeen met de rechte van 45° vanaf 0) die evenveel terecht-positieven detecteert als fout-positieven.
Wanneer de C statistiek hoger ligt dan 0,7 worden de modellen over het algemeen als aanvaardbaar aanzien en bij een C statistiek >0,8 als sterk aanvaardbaar (5).
De C statistiek is een waardevolle techniek omdat deze niet afhankelijk is van de frequentie van de uitkomstmaat, wat bij andere analysetechnieken wel het geval is (6).
In hun studie over de diagnostische waarde van BNP-bepaling versus ECG of RX-thorax presenteren Kelder et al. geen enkele grafiek (2). Ze geven de resultaten alleen weer in cijfers. Op basis van bovenvermelde normen tonen deze cijfers aan dat een RX-thorax, een ECG of een BNP-bepaling alle drie diagnostische modellen zijn met een ‘sterk’ toegevoegde waarde aan het klinische model, met BNP-bepaling als sterkste model.
In de cohortstudie over de prognostische waarde van het inspanningselectrocardiogram bij vermoeden van angor, publiceerden Sekhri et al. wel de ROC-curves (4) (zie figuur 2).
Figuur 2.
De ROC-curves met analyse van de C statistiek tonen aan dat toevoeging van een inspannings-ECG (korte stippellijn in het blauw) aan een klinische evaluatie (zwarte doorlopende lijn) of aan de klinische evaluatie + rust-ECG (grote stippellijn in het rood) slechts een beperkte prognostische meerwaarde heeft bij patiënten met pijn op de borst en vermoeden van angor.
- Koeck P. Helpt de bepaling van BNP de huisarts bij de diagnostiek van chronisch hartfalen? Minerva 2012;11(3):36-7.
- Kelder JC, Cowie MR, McDonagh TA, et al. Quantifying the added value of BNP in suspected heart failure in general practice: an individual patient data meta-analysis. Heart 2011;97:959-63.
- Schröder E. Prognostische waarde van het inspanningselectrocardiogram bij vermoeden van angor. Minerva 2011;10(1):6-7.
- Sekhri N, Feder GS, Junghans C, et al. Incremental prognostic value of the exercise electrocardiogram in the initial assessment of patients with suspected angina: cohort study. BMJ 2008;337:a2240.
- Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.
- Ash A, Shwartz M. R2: a useful measure of model performance when predicting a dichotomous outcome. Stat Med 1999;18:375-84.
Commentaar
Commentaar