Tijdschrift voor Evidence-Based Medicine
Waarom continue variabelen uitdrukken in z-scores?
In een recente RCT wou men bij ouderen met cognitieve achteruitgang het effect van een multicomponente interventie op het cognitieve functioneren onderzoeken (1). Om een effect te kunnen meten gebruikten de onderzoekers de Neuropsychological Test Battery (NTB of MTB - Mental Test Battery) na randomisatie en na 12 en 24 maanden follow-up. De NTB bestaat uit 14 verschillende testen die allemaal verschillende schalen gebruiken. Dat maakt het onmogelijk om de verschillende scores bij elkaar op te tellen. Een globale score zal dus alleen mogelijk zijn als we de verschillende scores vooraf standaardiseren.
Een z-score geeft aan hoeveel standaarddeviaties een gevonden waarde afwijkt van de (gemiddelde) waarde die we verwachten in de populatie. De z-score van een gevonden waarde kan dus berekend worden op basis van de gevonden waarde X, de gemiddelde waarde (of de verwachtingswaarde) μ van de populatie en de standaarddeviatie σ van de populatie. (2)
Voor een bepaalde variabele krijgt iedere persoon aldus een plaats ten opzichte van het gemiddelde van de populatie. De gemiddelde waarde kan men schatten op basis van een steekproef. Hoe verder iemand van het gemiddelde afwijkt, hoe groter de absolute waarde van zijn z-score zal worden. Een positief en negatief teken geeft aan wie respectievelijk boven en onder het gemiddelde zit. Als de variabele normaal verdeeld is in de populatie, zal 68% van alle personen een z-score tussen -1 en 1 hebben, 95% tussen -2 en 2 en 99,7% binnen 3 standaarddeviaties ten opzichte van het gemiddelde. Personen met een z-score groter dan 3 of kleiner dan -3 kan men dus als outliers beschouwen.
Een interessant gevolg van het feit dat de gevonden waarde gedeeld wordt door de standaarddeviatie, is dat daardoor ook de meeteenheid van de variabele verdwijnt. Daardoor wordt het mogelijk om z-scores op verschillende variabelen met elkaar te vergelijken en eventueel bij elkaar op te tellen.
Als we terugkeren naar ons voorbeeld (1): voor elke component van de NTB werd de z-score voor zowel de interventie- als de controlegroep berekend door gebruik te maken van het gemiddelde en de standaarddeviatie van alle deelnemers voor wie bij de start van de studie een waarde bekend was. Daarna kon de gemiddelde z-score voor NTB in de interventie- en de controlegroep berekend en vergeleken worden.
Besluit
De z-score is een dimensieloos getal dat aangeeft in welke mate een persoon of een groep personen afwijkt van de gemiddelde waarde van een variabele in de populatie. Hierdoor kan men de waarde van verschillende variabelen beter vergelijken en eventueel optellen.
- Vermeulen B. Vermindert een multicomponente interventie cognitieve achteruitgang bij ouderen? Minerva 2015;14(8):100-1.
- Sedgwick P. Standardisation of outcome measures (z-scores). BMJ 2012;345:e6178.
Commentaar
Commentaar