...
McKinney et al. verzamelden screeningmammografieën van bijna 29.000 vrouwen. Voor iedere vrouw was geweten of ze achteraf op biopt een diagnose van borstkanker kreeg, dan wel of ze minstens een jaar lang normale radiologische bevindingen handhaafde. Bij het voorspellen van deze uitkomsten presteerde het AI-systeem beter dan wat radiologen hadden neergezet. In een gecontroleerde studie versloeg het bovendien zes expert-radiologen die 500 at random geselecteerde mammografieën opnieuw bekeken.De auteurs geven zelf aan dat meer klinische studies nodig zijn om tot een bruikbaar systeem te komen. Zo werden niet alle bestaande technologische varianten van de mammografie in de studie gebruikt. De resultaten behelzen globaal 2D- en 3D-mammografie, zonder onderscheid per type. Bovendien, zo stellen commentatoren vast, is de onderzoekspopulatie niet duidelijk omschreven, terwijl de resultaten van screening mee worden bepaald door de karakteristieken daarvan. Gegevens vanuit de algemene bevolking moeten de bruikbaarheid van het AI-systeem bevestigen.De voorzichtigheid is des te groter omdat een AI-systeem avant la lettre al eerder teleurstellende resultaten opleverde. Het algoritme van deze 'computer-aided detection' (CAD) was gebaseerd op mammografieën waarbij de radioloog hetzij borstkanker had opgemerkt, hetzij een vals-negatief resultaat had gesorteerd. Het systeem maakte op de mammografie aanduidingen om de aandacht van de radioloog te vestigen op zones die mogelijk afwijkend waren. Daarna besliste de radioloog of er al dan niet sprake was van een verdacht letsel.CAD scoorde goed in een experimentele setting, maar ging af in de dagelijkse praktijk. De accuraatheid van de radiologische detectie werd er niet beter op. Integendeel, de specificiteit was ongeveer dezelfde als bij de klassieke werkwijze, maar de gevoeligheid daalde. Men denkt dat het overvloedige aantal aanduidingen die het systeem opleverde uiteindelijk resulteerde in een ongunstige weerslag op de alertheid van de radioloog. Hoe dan ook, CAD was een insteek waarbij het menselijke oog het uiteindelijke beleid bepaalde: als de arts geen graten in het beeld zag, werd het alsnog als normaal weggezet. En laat het nu net de bedoeling zijn dat de informatica in de mammografie contrasten opspoort die buiten het bereik van onze visus liggen.Als men in het andere geval AI laat beslissen over het al dan niet afwijkende karakter van een beeld - wat de radioloog er ook over denkt -, bestaat het risico dat andersom het aantal vals-positieve resultaten stijgt. Dat risico kan in onderzoek becijferd worden, zeggen commentatoren op de nieuwssite van Nature. Aan de hand hiervan moet men een klinisch beleid uitwerken bij beelden waarover radioloog en computer het niet eens zijn. Precies daar zal de potentiële winstmarge van AI tot uiting komen.De vaak geformuleerde en sussende gedachte dat de machine de arts niet kan vervangen, blijft voorlopig ook hier overeind. Bovenop de huidige vraagstukken rond de rol van AI bij de diagnose van borstkanker, komt het feit dat dit maar een deelgebied van de radiologie is. Het algoritme is vrij eenvoudig: het letsel lijkt verdacht of ook niet. Bij heel wat andere aandoeningen pakt het beslissingsproces veel complexer uit. Radiologen zullen dus nog even roeien met de riemen die ze nu al hebben.