Diagnostisch onderzoek en kanskapitalisatie
In diagnostisch onderzoek wordt vaak een verscheidenheid aan tests afgenomen. Een bekend risico hierbij is dat naarmate meer tests worden afgenomen, de kans op toevalsbevindingen toeneemt. Dit kan resulteren in overdiagnosticering, onnodige behandeling, onnodige belasting van cliënt/patiënt en onnodige bekostigingsdruk (zie bv. Huizenga et al., 2016).
In PDDB 3.0 wordt in deze context benadrukt om voor het meten van de drie criteriumvaardigheden, per vaardigheid één a priori vastgelegde toets te gebruiken. Dit, zo wordt gesteld, om het gevaar van ‘kanskapitalisatie’ tegen te gaan (zie paragraaf 2.5.2.). De Wetenschappelijke Adviesraad Dyslexie merkt dat de term kanskapitalisatie her en der tot vragen heeft geleid en geeft daarom een korte uitleg.
Kanskapitalisatie is het vergroten van de kans om een uitkomst te vinden. In wetenschappelijk onderzoek kan dit gebeuren wanneer een onderzoeker verschillende tests uitvoert (zonder hiervoor te corrigeren in de statistische toetsing) en de statistisch significante uitkomsten selecteert voor de ondersteuning van zijn of haar verwachting. Dit leidt tot een sterke verhoging van de kans op vals positieve bevindingen (men kapitaliseert immers op de kans hierop). Dit is makkelijk voor te stellen door het hypothese toetsen te vergelijken met een bak met 5 rode en 95 gele balletjes. Als je blind een balletje pakt, is de kans 5% dat het een rode is. Maar als je drie keer graait in de bak (met terugleggen – denk aan het eerste jaar statistiek), dan is die kans opeens zo’n 14%. Graai je 10 keer, dan is de kans om ten minste één keer een rood balletje te treffen alweer opgelopen tot 40%.
Hetzelfde geldt voor diagnostisch testen. Diagnostische testen hebben een foutenmarge, wat betekent dat iemands waargenomen prestatie zal fluctueren rond de ‘ware’ competentie van die persoon, soms wat hoger en soms wat lager. Wanneer je een groep mensen onderzoekt, kan dit enerzijds leiden tot een aantal vals negatieven, doordat iemand toevallig boven een criteriumwaarde scoort, terwijl zijn/haar ware leesniveau eronder ligt. Door in het protocol te werken met combinaties van scores op woordlezen, pseudowoordlezen en spellen, beheersen we dit risico.
Anderzijds is er het risico op vals positieve gevallen, oftewel, een situatie waarin iemand toevallig onder een criteriumwaarde scoort, terwijl zijn/haar ware leesniveau erboven ligt. Wanneer er voor een bepaalde vaardigheid, bv. woorden lezen, één toets wordt afgenomen, is het gevaar op een valse positieve bevinding klein. We maken namelijk gebruik van testen die betrouwbaar en valide zijn gebleken. Wanneer er echter voor het meten van woorden lezen drie toetsen worden afgenomen, en iedere test die uitval laat zien als indicatie voor een ernstig leesprobleem wordt gebruikt, dan neemt de kans op vals positieve gevallen substantieel toe. Ter visualisering: denk hierbij aan de rode balletjes als vals positieve bevindingen.
Dit laatste is natuurlijk onwenselijk, omdat dit leidt tot de eerder genoemde overdiagnosticering. Hierdoor kunnen middelen (denk aan personele bezetting en financiële middelen) voor de eigenlijke doelgroep onder druk komen te staan. In het PDDB3.0 wordt ernaar gestreefd om de doelgroep van kinderen met ernstige dyslexie zo optimaal mogelijk te selecteren. Vandaar dat in het protocol (§2.5.2) wordt voorgeschreven om voor de criteriummaten per maat één (vooraf vastgelegde) toets te hanteren.
Referenties
Huizenga, H. M., Agelink van Rentergem, J. A., Grasman, R. P., Muslimovic, D., & Schmand, B. (2016). Normative comparisons for large neuropsychological test batteries: User-friendly and sensitive solutions to minimize familywise false positives. Journal of Clinical and Experimental Neuropsychology, 38(6), 611-629.