Tijdschrift voor Evidence-Based Medicine
Prostaatkanker: kan screening de mortaliteit reduceren?
Minerva 2001 Volume 30 Nummer 3 Pagina 127 - 131
Zorgberoepen
Samenvatting |
Achtergrond |
Prostaatkanker is de tweede doodsoorzaak bij mannen in de westerse wereld. De behandeling van gevorderde of gemetastaseerde prostaatkanker heeft enorme vooruitgang geboekt. Toch gaat men ervan uit dat alleen (vroege) behandeling van gelokaliseerde tumoren een significante reductie van het aantal overlijdens kan bewerkstelligen. Het ‘Laval University Prostate Cancer Screening program (LUPCSP)’ dat in november 1988 van start ging, stelt zich tot doel om het effect van screening op mortaliteit te onderzoeken. |
|
Bestudeerde populatie |
Alle 46.193 mannen tussen 45 en 80 jaar oud die in 1985 op de kieslijst van de stad Québec waren ingeschreven, kwamen in aanmerking voor het onderzoek. |
|
Onderzoeksopzet |
Gerandomiseerd, gecontroleerd onderzoek (RCT). In totaal werden 30.956 mannen per brief uitgenodigd voor jaarlijkse screening in een prostaatkliniek. De andere 15.237 mannen werden toegewezen aan de controlegroep. Screening bestond uit PSA-meting (met 3,0 ng/ml als bovengrens voor normaal) en een digitaal rectaal onderzoek. Transrectale echografie (TRUS) en/of biopsie werden uitgevoerd indien de PSA-waarde en/of toucher afwijkend waren. Patiënten werden opgevolgd tot eind 1996. De controlegroep werd niet gescreend, maar volgens ‘current medical practice’ opgevolgd (n.v.d.r.: dit wordt niet omschreven). |
|
Uitkomstmeting |
Primaire uitkomstmaat was dood door prostaatkanker. |
|
Resultaten |
Tussen 1989 en 1996 werden 137 overlijdens door prostaatkanker geregistreerd in het cohort stamt af van de Latijnse term voor een gevechtseenheid. In de epidemiologie is een cohort een groep personen die gedurende een bepaalde periode in een onderzoek wordt opgevolgd.">cohort van 38.056 mannen die niet werden gescreend; in de gescreende groep waren er 5 overlijdens op 8.137 mannen. De incidentie kan op twee manieren worden weergegeven: als cumulatieve incidentie of als incidentiecijfer. De cumulatieve incidentie (syn: 'risico') is de 'proportie' van het aantal personen in een populatie dat binnen een bepaalde tijdsperiode een ziekte ontwikkelt. De cumulatieve incidentie berekent men door het aantal nieuwe gevallen tijdens de onderzoeksperiode te delen door het aantal personen zonder de ziekte in de populatie in het begin van de onderzochte tijdsperiode. Bijvoorbeeld, in een populatie van 10.000 personen worden gedurende één jaar twee nieuwe gevallen van coloncarcinoom vastgesteld; de (cumulatieve) incidentie van coloncarcinoom in deze populatie is dus 2 per 10.000 per jaar. Het incidentiecijfer wordt berekend door het aantal nieuwe zieken in een bepaalde periode te delen door de ‘populatie at risk’. De populatie at risk wordt bepaald door het totaal aantal tijdseenheden dat alle personen in het onderzoek het risico liepen om de ziekte te ontwikkelen, zoals per 1.000 patiëntjaren. Bijvoorbeeld, in een studie over het optreden van ernstige gastrointestinale bloedingen bij gebruik van NSAID’s worden bij 16 patiënten gastrointestinale bloedingen vastgesteld. De duur van de studie is 9 maanden, maar niet alle patiënten worden even lang opgevolgd. Men telt de duur van follow-up van alle patiënten bij elkaar op en komt tot een totaal van 8.000 patiëntjaren; het incidentiecijfer in deze populatie is dus 16/8.000 of 2/1.000 patiëntjaren.">incidentiecijfers voor mortaliteit door prostaatkanker over een periode van acht jaar was 48,7 per 100.000 cohortonderzoek alle personen in de onderzoeksgroep gedurende dezelfde periode geobserveerd zijn, kunnen de incidentiecijfers gemakkelijk berekend worden. Echter, bij cohortonderzoeken met een langdurige follow-up periode kunnen meestal niet alle onderzochte personen even lang worden geobserveerd. Om rekening te houden met de variërende observatieperioden wordt gebruik gemaakt van patiëntjaren of persoonjaren bij het berekenen van incidentiecijfers. Het aantal patiëntjaren of persoonjaren is de som van de observatieduur (deelname aan het onderzoek) van alle afzonderlijke deelnemende personen.">manjaren in de niet-gescreende groep vergeleken met 15 per 100.000 manjaren in de gescreende groep (p<0,01). Dit resulteert in een odds ratio van 3,25 in het voordeel van screening. |
De auteurs concluderen dat jaarlijkse of tweejaarlijkse screening met behulp van PSA-metingen vanaf de leeftijd van 50 jaar (en vanaf 45 jaar voor hoogrisicogroepen) zeer efficiënt is om mannen met een hoog risico op prostaatkanker te identificeren. |
|
Belangenvermenging/financiering |
Niet vermeld |
Bespreking |
In hun artikel besluiten LABRIE et al. dat wanneer PSA-screening gestart wordt op de leeftijd van 50 jaar (of 45 jaar bij hogere risicogroepen), jaarlijkse of tweejaarlijkse bepaling van PSA zeer efficiënt is in het identificeren van mannen die een hoog risico hebben om te lijden aan prostaatkanker. Het koppelen van deze aanpak aan een behandeling van de gelokaliseerde ziekte toont voor het eerst dat vroegtijdige diagnose en behandeling een dramatische daling in de prostaatkankersterfte kan bewerkstelligen. |
|
Screenen tot welke prijs? |
Een belangrijke beperking in deze conclusie is het ontbreken van informatie over de neveneffecten van dit gezondheidszorgaanbod. Wat de prijs is die voor de aangehaalde mortaliteitsreductie moet worden betaald? Uiteraard heeft dit tekort te maken met de beperkte relevantie van de in dit artikel behandelde onderzoeksvragen. Ook hierin wordt geen aandacht besteed aan de eventuele negatieve consequenties van het screeningaanbod. Een veralgemeende prostatectomie bij mannen op hun twintigste kan alleszins de prostaatkanker-mortaliteit nog drastischer doen dalen dan de door de auteurs verheerlijkte prostaatkankerscreening, maar wie zou daar voorstander van zijn? Eén en ander hoeft natuurlijk niet te verwonderen. Niet voor niets worden de ‘evangelisten’ voor screening meestal gevonden onder de rangen van de clinici en hebben de professionelen in het domein van de volksgezondheid veeleer de ingesteldheid van ‘slakken’. Het is nochtans ook bij clinici de gewoonte bij de rapportering van clinical trials oog te hebben voor de neveneffecten. Zeker wanneer de populatie voor wie het zorgaanbod bedoeld is, vrij is van symptomen, moet het beperken van de neveneffecten een zeer belangrijk aandachtspunt zijn. De ruilwaarde voor deze neveneffecten beperkt zich immers tot het verlagen van een ontastbaar ziekterisico 1. |
|
Een gezondheidsprobleem? |
Naast deze zeer fundamentele bemerking over de relevantie van zowel de onderzoeksvraag als de conclusie zijn er ook een aantal methodologische tekortkomingen. Een eerste bedenking heeft te maken met het kwantificeren van het gezondheidsprobleem. Zonder afbreuk te willen doen aan de vaststelling dat de prostaatkankermortaliteit aanzienlijk is, kan men ze niet zonder meer vergelijken met de borstkankermortaliteit. Prostaatkankersterfte is laattijdige sterfte (de gemiddelde levensverwachting van de sterfgevallen van prostaatkanker is een stuk beter dan die van de gemiddelde man), terwijl borstkankersterfte hoofdzakelijk voorkomt bij jongere vrouwen. De studie startte in november 1988. Aselect werden 46.193 mannen toegewezen aan een interventiearm en een controlearm op basis van een ratio 2:1. De beschrijving van wat de experimentele interventie betekent, gebeurt accuraat; de inhoud van de ‘current medical practice’ die wordt toegepast op de controlearm, is totaal onduidelijk. Het effect van screening op de mortaliteit werd bepaald aan de hand van een vergelijking van de oorzaakspecifieke mortaliteit in de periode vanaf januari 1989 tot eind 1996. Een effect op mortaliteit is echter niet op dergelijke korte termijn te verwachten. Het lijkt dus zelfs zeer onwaarschijnlijk dat een eventueel verschil in prostaatkankermortaliteit in deze korte periode kan worden verklaard door het verschil in screeningactiviteit in dezelfde periode. |
|
Zijn de groepen vergelijkbaar? |
De auteurs gaan er prat op dat dit de eerste gerandomiseerde prospectieve studie is over prostaatkankerscreening en dat de gescreenden een 69% lagere prostaatkankersterfte hebben dan de niet-gescreenden. Beide statements hebben echter met elkaar niets te maken. Na de randomisatie betekent dat iedere aan het onderzoek deelnemende persoon evenveel kans heeft om in één van de onderzoeksgroepen terecht te komen. De verdeling in groepen gebeurt meestal aan de hand van 'random numbers'.">randomisatie werd de ene groep uitgenodigd om screening te ondergaan; de andere niet. De eerste stap bij de analyse zou logischerwijze een ‘intention to screen’-analyse zijn. Hierbij worden de eindpunten vergeleken tussen de groepen die bedoeld waren om de experimentele blootstellingalternatieven te ondergaan. Deze analyse leert ons dat op het einde van de observatieperiode in de uitgenodigde groep (n=31.300) 140 en in de niet-uitgenodigde groep (n= 15.432) 73 prostaatkankersterfgevallen voorkwamen. Dit betekent een zes procent hogere sterfte bij de niet-gescreenden (niet-significant). In de veronderstelling dat de randomisatie geleid heeft tot twee voor het risico op prostaatkankersterfte vergelijkbare subpopulaties, is dit het enige gegeven dat iets zegt over de effectiviteit van prostaatkankerscreening. Randomisatie is echter een techniek die wordt toegepast om verschillen in onbekende determinanten door het toeval te beperken. Bekende determinanten (zoals leeftijd) worden het best gecontroleerd door een stratificatie verdeelt men een onderzoekspopulatie in één of meerdere subcategorieën volgens bepaalde criteria, zoals leeftijd, geslacht, sociale status, etc. Deze techniek wordt toegepast om de invloed van confounders of verstorende variabelen op te vangen.">stratificatie van de onderzoeksgroep over de verschillende categorieën van deze determinanten, gevolgd door een randomisatie binnen deze categorieën over de experimentele alternatieven. Dit werd in deze studie niet toegepast. Meer nog, de randomisatie werd toegepast op de bronpopulatie vooraleer hieruit de niet-includeerbare (omwille van aanwezigheid van prostaatkanker of sterk vermoeden van aanwezigheid bij de start van de studie) personen werden verwijderd. In de uitgezuiverde studiepopulatie bedraagt de incidentiedichtheid 97 op 202.697 personenjaren bij de uitgenodigden en 45 op 110.067 personenjaren bij de niet-uitgenodigden. Het verschil bedraagt hier 17% maar de vergelijkbaarheid wordt nu zelfs niet meer door de randomisatie gegarandeerd. |
De auteurs rapporteren echter eerst een andere vergelijking, namelijk die van het deel van de uitgenodigde groep dat echt werd gescreend met het deel van de niet-uitgenodigde groep dat effectief ook niet werd gescreend. Dit levert een mortaliteitsverschil van 67,1% op (ten ‘voordele’ van de gescreende groep) dat bovendien significant is (p=0,02). Dat dit verschil een toevallige vondst zou zijn, lijkt inderdaad weinig waarschijnlijk en dat het verschil het resultaat zou zijn van de screening al evenmin. Het niet vergelijkbaar zijn van participanten en niet-participanten aan screening voor verschillende kenmerken (waaronder socioeconomische status en dus ook het risico op ziekte) werd reeds eerder in verschillende studies aangetoond (in ons land reeds door VERMOST in 1978 2 ). |
|
Interpretatie van de resultaten |
In de passage na deze vergelijking volgt een opeenstapeling van redeneringen die alle elementaire regels met betrekking tot de data-analyse in de wind slaan. Het niet-significant zijn van het verschil in incidentiedichtheid (door de auteurs een ‘annual death rate’ genoemd!), respectievelijk 53,0 en 41,6 per 100.000 personenjaren (p=0,22), wordt geïnterpreteerd als ‘er is dus geen verschil’. Omdat de associaties (op basis van odds ratio) tussen screening en sterfte voor diegenen die zich gehouden hebben aan de experimentele blootstelling (de uitgenodigde gescreenden en de niet-uitgenodigde niet-gescreenden) en diegenen die zich er niet aan gehouden hebben (de niet-uitgenodigde gescreenden vergeleken met de uitgenodigde niet-gescreenden) niet significant verschillen, wordt gesteld dat de vastgestelde associaties niets met de randomisatie kunnen te maken hebben en dat screening dus de enig mogelijke significante determinant kan zijn (begrijpe wie kan). Uit deze niet steekhoudende redeneringen concluderen de auteurs dat het gerechtvaardigd is om zowel de gescreenden als de niet-gescreenden in één analyse te poolen. Het is dan uiteindelijk deze analyse die een reductie van de prostaatkankermortaliteit met 69% oplevert, een reductie die ‘dus’ het gevolg is van screening. |
|
Exclusiecriteria |
Bijkomende bron van vertekening door selectie is dat de voorgestelde exclusiecriteria (vrij van prostaatkanker of van een sterk vermoeden op basis van eerder onderzoek) bij de gescreenden meer van toepassing zullen zijn aangezien de vroegdiagnostiek voor prostaatkanker (al dan niet op basis van PSA-testen) op het moment van de start van deze studie reeds deel uitmaakte van de ‘current medical practice’. In deze groep verwacht men dus a priori een beperking tot incidente (nieuwe) gevallen in tegenstelling tot bij de niet-gescreenden, waar het aandeel prevalente (langer aanwezige en dus verder gevorderde) gevallen groter zal zijn. |
|
Intention to screen |
Ongetwijfeld leidt de ‘intention to screen’-analyse hier tot een vertekend resultaat ten gevolge van misclassificatie van blootstelling (slechts 23,1% van de uitgenodigden werd gescreend, terwijl bij de niet-uitgenodigden 6,5% werd gescreend). De auteurs misbruiken echter deze analyse om in te schatten wat het verschil in prostaatkankersterfte zou kunnen zijn bij 100%-compliance en bij het ontbreken van de contaminatie die ze zelf hebben veroorzaakt door eerst te randomiseren en dan te excluderen. Ze gaan hierbij voorbij aan het feit dat deze compliance gerelateerd kan zijn aan de onderzoeksvraag en dat daardoor bij deze schatting een probleem van validiteit ontstaat. Het feit dat de eerst beschreven vergelijking binnen de marge valt van de schatting op basis van de ‘intention to screen’-analyse, doet de auteurs besluiten dat ze het waarschijnlijk dan toch bij het rechte eind hebben. In het relaas van deze studie wordt verder nog aandacht besteed aan de impact van de screening op de levensverwachting. Voor de bruikbaarheid van deze informatie gelden echter dezelfde bedenkingen met betrekking tot de vergelijkbaarheid van gescreenden en niet-gescreenden als hierboven. |
|
Onvoldoende bewijs voor effect van screening |
In deze studie is er dus geen evidentie voor een gunstig effect van screening, niet op basis van de vergelijking tussen de niet-gerandomiseerde gescreenden versus niet-gescreenden en ook niet op basis van de ‘intention to screen’-analyse. Dit laatste niet omdat het vastgestelde verschil niet-significant is, maar omwille van het niet-relevante tijdskader waarbinnen de effecten van screening werden opgemeten. In deze studie is ook geen evidentie voor het ontbreken van een gunstig effect of voor het aanwezig zijn van een ongunstig effect. Er is gewoon geen evidentie aanwezig ten gevolge van een slecht ‘study design’. In de discussie wordt echter met geen woord gerept over de hierboven genoemde methodologische beperkingen van dit onderzoek. Meer nog, de auteurs beweren zonder enige vorm van zelfkritiek dat tien jaar na de start van deze screeningstudie, de voorliggende gegevens duidelijk de werkzaamheid van een geneesmiddel of interventie verwijst naar het gunstige effect ervan in optimale omstandigheden. De werkzaamheid wordt idealiter vastgesteld in een randomised controlled trial (RCT).">werkzaamheid, de betrouwbaarheid, de haalbaarheid en de aanvaardbaarheid van de diagnose van gelokaliseerde prostaatkanker in de algemene bevolking aantonen. Er wordt dan ook een oproep gelanceerd om over te gaan tot het veralgemeend toepassen van de prostaatkankerscreening en dit dan op basis van PSA-bepaling (zonder digitaal rectaal onderzoek), waarbij een pleidooi wordt gehouden om de grenswaarde te verlagen naar 3,0 ng/ml en dit enkel gefundeerd op de vaststelling dat hierdoor de sensitiviteit (gevoeligheid) van een test is de proportie van werkelijk zieken in de populatie bij wie een positief testresultaat werd gevonden (ten opzichte van alle zieke personen). Een test met een hoge sensitiviteit detecteert een hoge proportie van werkelijk zieke personen. Sensitiviteit = a / a + c">sensitiviteit toeneemt. Wat de impact hiervan is op de specificiteit van een test is de proportie van personen in de populatie die de ziekte niet hebben en bij wie een negatief testresultaat werd gevonden (ten opzichte van alle personen die de ziekte niet hebben). Een test met een hoge specificiteit geeft weinig fout-positieve resultaten. Specificiteit = d / b + d.">specificiteit, wordt door de auteurs niet vermeld. |
Aanbeveling voor de praktijk |
Uit deze studie zou blijken dat jaarlijkse of tweejaarlijkse screening met PSA-metingen bij patiënten vanaf vijftig jaar de mortaliteit door prostaatkanker kan reduceren. Bovenstaande bespreking wijst echter op fundamentele methodologische tekortkomingen in de studie. Er zijn dus nog steeds geen goede studies die systematische screening naar prostaatkanker onderbouwen. De redactie |
Literatuur
|
Auteurs
Weyler J.
Vakgroep Epidemiologie en Sociale Geneeskunde, Universiteit Antwerpen
COI :
Woordenlijst
cohort, incidentie, intention to treat, patiëntjaren, sensitiviteit, specificiteit, stratificatie, werkzaamheidCodering
Commentaar
Commentaar