Narzędzie sztucznej inteligencji giganta technologicznego Microsoft postawiło prawidłową diagnozę dla zdecydowanej większości pacjentów w niewielkim badaniu.
Microsoft oświadczył, że jest o krok bliżej do "medycznej superinteligencji" po tym, jak nowe narzędzie sztucznej inteligencji pokonało lekarzy w diagnozowaniu złożonych problemów medycznych.
Giganci technologiczni ścigają się w rozwijaniu superinteligencji, która odnosi się do systemu AI przewyższającego ludzkie zdolności intelektualne i obiecują wykorzystać ją do wywrócenia do góry nogami systemów opieki zdrowotnej na całym świecie.
W najnowszym eksperymencie Microsoft przetestował system diagnostyczny AI przeciwko 21 doświadczonym lekarzom, wykorzystując rzeczywiste dane przypadków 304 pacjentów, które zostały opublikowane w "New England Journal of Medicine", wiodącym czasopiśmie medycznym.
Narzędzie AI prawidłowo zdiagnozowało do 85,5 procent przypadków - około cztery razy więcej niż grupa lekarzy z Wielkiej Brytanii i Stanów Zjednoczonych, którzy mieli od pięciu do 20 lat doświadczenia.
Model był również tańszy niż lekarze, zlecając mniej skanów i testów w celu postawienia prawidłowej diagnozy.
Microsoft stwierdził, że odkrycia wskazują, że modele AI mogą analizować złożone problemy diagnostyczne, które są trudniejsze dla lekarzy, którzy specjalizują się w swoich dziedzinach, ale nie są ekspertami w każdym aspekcie medycyny.
Jednak sztuczna inteligencja "może łączyć zarówno szeroki zakres, jak i głębię wiedzy specjalistycznej, demonstrując możliwości rozumowania klinicznego, które w wielu aspektach przewyższają możliwości lekarza" - stwierdzili dyrektorzy Microsoftu w komunikacie prasowym.
"Ten rodzaj rozumowania może potencjalnie zmienić opiekę zdrowotną".
Microsoft nie widzi sztucznej inteligencji zastępującej lekarzy w najbliższym czasie, twierdząc, że narzędzia te pomogą lekarzom zautomatyzować niektóre rutynowe zadania, spersonalizować leczenie pacjentów i przyspieszyć diagnozy.
Jak działa model?
System sztucznej inteligencji Microsoftu postawił diagnozę, naśladując proces zbierania danych pacjenta przez lekarza, zlecania testów i ostatecznie zawężania diagnozy medycznej.
AI posiadała informacje ze studiów przypadków pacjentów. Współpracowała ona z "orkiestratorem diagnostycznym", który zadawał pytania i zlecał testy, otrzymując wyniki z rzeczywistych badań.
Firma przetestowała system z wiodącymi modelami sztucznej inteligencji, w tym GPT, Llama, Claude, Gemini, Grok i DeepSeek.
Model o3 OpenAI, który jest zintegrowany z ChatGPT, poprawnie rozwiązał 85,5 procent przypadków pacjentów, w porównaniu do średnio 20 procent w grupie 21 doświadczonych lekarzy.
Ograniczenia i kolejne kroki
Naukowcy opublikowali swoje odkrycia jako artykuł preprint, co oznacza, że nie został on jeszcze poddany wzajemnej weryfikacji.
Microsoft przyznał się również do pewnych kluczowych ograniczeń, w szczególności do tego, że narzędzie AI zostało przetestowane tylko pod kątem skomplikowanych problemów zdrowotnych, a nie bardziej powszechnych, codziennych kwestii.
Panel lekarzy pracował również bez dostępu do swoich kolegów, podręczników lub innych narzędzi z których zwykle korzystają podczas stawiania diagnozy.
"Zostało to zrobione, aby umożliwić uczciwe porównanie z ludzką wydajnością" - przekazał Microsoft.
Firma zaapelowała o więcej rzeczywistych dowodów na potencjał sztucznej inteligencji w klinikach zdrowia i stwierdziła, że "rygorystycznie przetestuje i zweryfikuje te podejście" przed jego szerszym udostępnieniem.