Modeli veštačke inteligencije zasnovani na jeziku ne uspevaju da postave odgovarajuću početnu dijagnozu u više od 80 odsto slučajeva, što ukazuje da još nisu bezbedni za samostalnu kliničku upotrebu, pokazuje nova studija.

Generativna veštačka inteligencija i dalje nema razvijene procese zaključivanja potrebne za sigurnu primenu u medicini, navodi se u istraživanju.

AI četbotovi jesu poboljšali tačnost dijagnostike kada im se pruže sveobuhvatni klinički podaci, ali i dalje ne uspevaju da ponude adekvatnu diferencijalnu dijagnozu u više od 80 odsto slučajeva, tvrde istraživači iz organizacije Mass General Brigham iz Bostona, jedne od najvećih zdravstvenih mreža u Sjedinjenim Američkim Državama.

Rezultati studije, objavljeni u medicinskom časopisu otvorenog pristupa JAMA Network Open, pokazuju da veliki jezički modeli i dalje ne dostižu nivo zaključivanja potreban za kliničku primenu.

"Uprkos stalnim poboljšanjima, standardni veliki jezički modeli još nisu spremni za samostalnu primenu u medicini", rekao je Mark Suči, jedan od autora studije.

On je dodao da veštačka inteligencija još ne može da reprodukuje proces diferencijalne dijagnoze, koji je ključan deo kliničkog razmišljanja i koji naziva „umetnošću medicine".
Diferencijalna dijagnoza predstavlja prvi korak u identifikaciji bolesti, kojim se određeno stanje razlikuje od drugih sa sličnim simptomima.

Kako su modeli testirani

Istraživački tim analizirao je rad 21 velikog jezičkog modela, uključujući najnovije verzije Claude-a, DeepSeek-a, Gemini-ja, GPT-a i Grok-a.

Modeli su testirani na 29 standardizovanih kliničkih scenarija uz pomoć novog alata nazvanog PrIME-LLM.

Ovaj alat procenjuje sposobnosti modela u različitim fazama kliničkog razmišljanja: postavljanje početne dijagnoze, određivanje potrebnih analiza, donošenje konačne dijagnoze i planiranje terapije.

Kako bi simulirali realne medicinske slučajeve, istraživači su modelima postepeno davali informacije, od osnovnih podataka poput starosti, pola i simptoma pacijenta, do nalaza pregleda i laboratorijskih rezultata.

Iako je diferencijalna dijagnoza ključna u praksi, u studiji su modeli ipak dobijali dodatne informacije kako bi mogli da nastave proces čak i kada u tom koraku pogreše.

Rezultati su pokazali da modeli postižu visoku tačnost kada je u pitanju konačna dijagnoza, ali imaju ozbiljne probleme sa postavljanjem diferencijalne dijagnoze i snalaženjem u situacijama neizvesnosti.

Autorka studije Arja Rao istakla je da ovakav pristup testiranju stavlja modele u ulogu lekara, a ne samo ulogu "polagača testa".

"Ovi modeli su veoma dobri u imenovanju konačne dijagnoze kada su svi podaci dostupni, ali imaju poteškoće na početku, kada informacija nema dovoljno", rekla je ona.

Istraživači su utvrdili da svi testirani modeli ne uspevaju da ponude odgovarajuću diferencijalnu dijagnozu u više od 80 odsto slučajeva.

Kada je reč o konačnoj dijagnozi, uspešnost se kretala od oko 60 do preko 90 odsto, u zavisnosti od modela.

Većina modela pokazala je bolju tačnost kada su, pored tekstualnih podataka, dobijali i laboratorijske nalaze i snimke.

Najbolje rezultate ostvarila je grupa modela među kojima su Grok 4, GPT-5, GPT-4.5, Claude 4.5 Opus, Gemini 3.0 Flash i Gemini 3.0 Pro.

Lekari su i dalje nezamenljivi

Ipak, autori naglašavaju da, uprkos napretku i poboljšanjima u novijim verzijama, veliki jezički modeli još nisu dostigli nivo inteligencije potreban za bezbednu primenu u medicini i i dalje imaju ograničenja u složenom kliničkom razmišljanju.

"Naši rezultati potvrđuju da je u primeni veštačke inteligencije u zdravstvu i dalje neophodan 'čovek', odnosno stalni nadzor stručnjaka", rekao je Suči.

Susana Manso Garsija, članica radne grupe za veštačku inteligenciju i digitalno zdravlje Španskog društva za porodičnu i opštu medicinu, koja nije učestvovala u istraživanju, istakla je da rezultati šalju jasnu poruku javnosti.

"Studija naglašava da se ovi modeli ne smeju koristiti za donošenje kliničkih odluka bez nadzora. Iako veštačka inteligencija predstavlja obećavajući alat, ljudska medicinska procena ostaje nezamenljiva", rekla je ona.

"Preporuka građanima je da ove tehnologije koriste oprezno i da se, u slučaju bilo kakvih zdravstvenih problema, uvek obrate lekaru."

(M.A./EUpravo zato/euronews.com)