Štatistika mesiaca Vyhľadávač spoločnosti Microsoft zvyšuje mieru prežitia o
Nestatistikou júna 2016 je správa, že vedci spoločnosti Microsoft môžu pomocou vyhľadávača „Bing“ zistiť rakovinu pankreasu, čo zachráni životy.

Toto včasné zistenie môže „zvýšiť päťročné prežitie pacienta z 3 percent na 5 až 7 percent,“ píše New York Times. Vedci spoločnosti Microsoft (Journal of Oncology Practice) hľadali u 6,4 milióna používateľov príznaky, ako je nevysvetliteľné chudnutie, a rizikové faktory, ako napríklad závislosť od alkoholu. Na základe vzorcov dotazov bol urobený pokus predvídať tých používateľov, ktorí neskôr zjavne dostali rakovinu, čo sa dalo odvodiť z dotazov typu „Prečo som dostal rakovinu pankreasu?“. Süddeutsche Zeitung vo svojom online vydaní 9. júna pod názvom „Diagnóza rakoviny z vyhľadávača“ informoval: „V 5 až 15 percentách prípadov ich dokázali odhaliť včas. Pôsobivejšie je veľmi malé množstvo falošných poplachov. Menej ako jeden z 10 000 používateľov bol nesprávne klasifikovaný ako pacient s rakovinou. ““
Ako je už zvykom, ľudia sa nepýtali, či je možné analyzovať ich osobné údaje. Čo však v prípade, že sa miera prežitia zdvojnásobí? Nakoniec sa ukázalo, že Bing zachraňuje životy. Naozaj?
Č. Nakoniec zvýšenie 5-ročného prežitia nehovorí nič o tom, či včasné odhalenie zachráni životy. Nie je ťažké to pochopiť. Spomeňte si na 100 ľudí, ktorí všetci zomrú na invazívnu rakovinu do 70 rokov. Ak nevykonajú skríning, rakovina sa zistí neskoro a päťročná miera prežitia je nízka. Ak prejdú na skríning, rakovina sa zistí skôr a päťročná miera prežitia sa zvýši. V tomto príklade nikto nežije dlhšie, iba dlhšie s diagnózou. Štúdie teda ukazujú, že vyššia miera prežitia po skríningu nie je spojená s nižšou úmrtnosťou. Trik s mierou prežitia nie je nový. V štatistike z októbra 2014 sme ukázali, ako sa dá použiť na podvádzanie žien o výhodách skríningu rakoviny prsníka. Teraz sa nás snažia presvedčiť o výhodách veľkých dát.
Čo však s malou falošne pozitívnou mierou 1 z 10 000, ktorú zdôrazňujú médiá? Znamená to, že medzi používateľmi, ktorých algoritmus hodnotí ako pozitívnych, sa chyby takmer nikdy nevyskytujú? Č. Aj to sa dá ľahko vysvetliť. Zoberme si 100 000 používateľov, z ktorých 10 má nezistenú rakovinu pankreasu. S mierou detekcie 10 percent (priemer 5 a 15 percent) očakávame, že iba jeden z týchto 10 bude klasifikovaný ako pozitívny, ďalších 9 druhov rakoviny bude prehliadaných. Z 99 990 používateľov, ktorí nemajú rakovinu, očakávame, že 10 z nich bude stále hodnotených kladne (miera falošne pozitívnych výsledkov 1 z 10 000). To znamená, že z celkového počtu 11 ľudí s pozitívnym výsledkom má jeden pacient rakovinu pankreasu a 10 nemá žiadny. Väčšina z tých, ktorí majú pozitívny test, je mylne klasifikovaná ako rakovina. Takže aj keď je miera falošne pozitívnych výsledkov nízka, podiel falošne pozitívnych výsledkov u všetkých pozitívnych látok môže byť stále vysoký u zriedkavých chorôb, ako je rakovina pankreasu.
Pamätáte si chrípkové trendy Google? Rovnako ako Bing, aj tento program bol navrhnutý na predpovedanie šírenia chrípky na základe vyhľadávaní. Bola vyhlásená v roku 2009 s fanfárami ako ukážkový príklad úspechu veľkých dát. Po rokoch predpovedania, že bola príliš vysoká, bola teraz bez fanfár pochovaná. Či už Dr. Google alebo Dr. Bing: Veľké dáta sú predovšetkým veľký biznis a nie nevyhnutne lepšia lekárska starostlivosť.