Da li ste čuli za Mythos Preview? Zašto je najmoćniji AI model previše opasan za javno puštanje?

Foto: Shutterstock/ Sidney van den Boogaard

Kompanija Anthropic sa sedištem u SAD objavila je da njen najnoviji model veštačke inteligencije, Mythos Preview (zvanično "Claude Mythos Preview"), nije spreman za javno lansiranje zbog rizika da bi mogao biti zloupotrebljen od strane sajber-kriminalaca i špijuna.

Model, koji je predstavljen ove nedelje kao general-purpose jezički AI sistem, pokazao je izuzetnu sposobnost da otkriva ozbiljne bezbednosne ranjivosti u operativnim sistemima i veb pregledačima.

Zbog toga bi njegova javna dostupnost mogla predstavljati značajnu pretnju sajber bezbednosti.

Ranjivosti koje izazivaju zabrinutost

Prema objavljenoj dokumentaciji, Mythos Preview je sposoban da izvrši instrukcije koje mu omogućavaju da "pobegne" iz virtuelnog okruženja (sandboxa), zaobilazeći sigurnosne i mrežne kontrole.

U jednom testu, model je uspeo da pošalje poruku nakon što je zaobišao ograničenja, a potom je čak objavio detalje o svom postupku na javno dostupnim, ali teško pronalazivim sajtovima.

Anthropic je otkrio da je Mythos pronašao greške u Linux kernelu, koji pokreće većinu svetskih servera, i povezao ih tako da bi haker mogao preuzeti kontrolu nad bilo kojom mašinom koja koristi taj sistem. Model je takođe identifikovao 27 godina staru ranjivost u OpenBSD-u, operativnom sistemu koji se koristi u visoko bezbednim i kritičnim infrastrukturama.

Zbog ovih nalaza, Mythos Preview neće biti dostupan široj javnosti, već samo odabranim partnerima iz oblasti sajber-bezbednosti i softverske industrije.

Ograničen pristup kroz Project Glasswing

Model će biti korišćen u okviru novog Anthropic programa pod nazivom Project Glasswing, koji uključuje kompanije poput Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia i Palo Alto Networks. Cilj projekta je da se Mythos koristi za unapređenje bezbednosti i da se iskustva i zaključci podele među partnerima.

Ime projekta inspirisano je leptirskom vrstom glasswing, simbolom transparentnosti: model otkriva ranjivosti koje su uočljive, ali ne izaziva štetu.

Bezbedno korišćenje u budućnosti

Anthropic ističe da je krajnji cilj omogućavanje bezbednog korišćenja modela klase Mythos na velikoj skali, kako u sajber-bezbednosti, tako i u drugim primenama visokih performansi AI. Za to je neophodno razviti dodatne bezbednosne mere koje mogu detektovati i blokirati najopasnije izlaze modela.

Kompanija je u stalnom kontaktu sa američkom vladom o sposobnostima Claude Mythos Preview modela, kako u odbrambene, tako i u napadačke svrhe, naglašavajući da vlade imaju ključnu ulogu u proceni i ublažavanju rizika po nacionalnu bezbednost.

Konkurencija i budućnost AI

Direktor Anthropic-a, Dario Amodei, izjavio je da će slični moćni modeli uskoro stići i od drugih kompanija.

Logan Graham, vođa tima za frontier AI istraživanja u Anthropic-u, procenjuje da bi slični modeli mogli biti dostupni za šest do osamnaest meseci. Graham dodaje da je važno javno razgovarati o ovim rizicima kako bi industrija bezbednosti bila spremna.

(M.A./EUpravo zato/euronews.com)

TAGOVI