Istraživanje EU upozorava na propuste u testiranju veštačke inteligencije

ChatGPT — Foto: Iryna Imago/Shutterstock

Istraživači iz EU upozoravaju na ozbiljne probleme u načinu na koji se meri sposobnost veštačke inteligencije i pozivaju regulatore da obezbede da oznake i rezultati koje kompanije navode za svoje modele zaista znače ono što tvrde.

U novom izveštaju Zajedničkog istraživačkog centra Evropske komisije zaključuje se da AI merenja (tzv. benchmark testovi) obećavaju više nego što mogu da pruže. Autori navode da se vlasnički alati za poređenje modela lako mogu "namestiti" i da često mere pogrešne stvari.

Kompanije koriste ove testove kako bi pokazale koliko su njihovi modeli uspešni u određenim zadacima. Tako je, na primer, OpenAI testirao svoj novi GPT-5 u tome koliko pouzdano izbegava da odgovara na pitanja na koja zapravo nema odgovora, a rezultat je navodno bio bolji nego kod prethodne verzije. Ipak, istraživači iz EU pozivaju regulatore da se pažljivo posvete tome kako ti alati funkcionišu.

Za EU je ovo posebno osetljivo jer se njeni zakoni o veštačkoj inteligenciji oslanjaju na procenu mogućnosti modela u različitim kontekstima. Veliki modeli, recimo, mogu biti svrstani u kategoriju posebnog rizika na osnovu testova koji pokažu da imaju "visoke sposobnosti uticaja". Zakon omogućava Komisiji da precizno definiše šta to znači kroz posebne akte, ali to, do sada, još uvek nije urađeno.

U međuvremenu, američka vlada je prošlog petka predstavila paket sopstvenih alata za procenu AI sistema, koje će koristiti državne agencije. Njihov Akcioni plan za veštačku inteligenciju jasno naglašava cilj da SAD preuzmu lidersku ulogu na ovom polju.

Ključno pitanje je: kojim testovima zaista možemo da verujemo?

Istraživači iz EU poručuju da kreatori politika moraju da obezbede da se meri stvarna primenljivost AI sistema u realnom životu, a ne uski zadaci; da testovi budu jasno dokumentovani i transparentni; da precizno definišu šta se meri i na koji način; i da uzmu u obzir različite kulturne kontekste. Poseban problem je što se većina postojećih testova zasniva isključivo na engleskom jeziku.

"Posebno naglašavamo potrebu za novim načinima označavanja koji će pokazivati kojim testovima se može verovati", piše u izveštaju. Ako se uradi kako treba, istraživači tvrde da EU može iskoristiti priliku da ostvari novi oblik tzv. "briselskog efekta".

(EUpravo zato)

Prethodna vest Sledeća vest

Tagovi

Budi deo EUpravo zato zajednice.

Komentariši

Veštačka inteligencija nije tako moćna kako izgleda: EU tvrdi da kompanije preuveličavaju uspehe svojih modela

Ključno pitanje je: kojim testovima zaista možemo da verujemo?

Srednjoškolci iz Srbije osmislili biznise budućnosti: Najbolji tim predstavlja našu zemlju na evropskom finalu u Rigi

Portugal zabeležio najvišu majsku temperaturu ikada: U francuskim učionicama 53 stepena!

Putovanja i popusti na jednom mestu: Nova YUTA aplikacija okuplja ponude desetina agencija

Ovi evropski gradovi nude najjeftiniji odmor u 2026: Region među najpovoljnijima

Evropu potresa talas štrajkova lekara: Plate, iscrpljenost i odlazak kadra glavni problemi

EU ulaže milione u tehnološku nezavisnost: Španija dobila novi kvantni superračunar

"Pitaće te starost gde ti je bila mladost": Studija sa Oksforda otvorila staru raspravu

Rodna ravnopravnost na papiru i u praksi: Skoro polovina muškaraca smatra da muž treba da ima poslednju reč u kući

EU udarila žestoku kaznu jednoj od najpopularnijih onlajn platformi: Milioni evra zbog ozbiljnih propusta

Posetite Festival kuglofa u Sremskim Karlovcima: Zašto je ovaj kolač tako značajan?

Uvodi se kazna za one koji se sami voze u automobilima: Novi radari prepoznaju broj putnika i automatski kažnjavaju

Nude platu i od 200.000 dinara, ali se niko ne javlja: Gazda Paja šokiran iako nudi slobodne vikende i besplatan obrok

Top 5 pouzdanih automobila do 3.000 evra: Delovi se lako nalaze, stručnjaci i taksisti ih preporučuju

Zašto su čepovi pričvršćeni za flašu? Direktiva EU koja je razbesnela Evropljane i te kako opravdana

Imaju prosečnu platu od oko 4.500 EUR i savršenu prirodu! Ovo je najbolja država za preseljenje u 2025.