Metin projekat No Language Left Behind (NLLB) objavio je da su proširili usluge svoje originalne tehnologije na oko 200 jezika.

Projekat uključuje desetak evropskih jezika sa ne toliko velikim brojem korisnika, kao što su škotski gelski (ili škotski galski), galicijski, irski, ligurski, bosanski, islandski i velški.

Prema Meti, to je jezički program koji ima manje od milion rečenica u podacima koji se mogu koristiti.

Ipak, stručnjaci kažu da bi za poboljšanje usluge Meta trebalo da se konsultuje sa stručnjacima za jezike i lingvistima koji poznaju te izvorne jezike jer je na alatu još potrebno raditi.

Koristi i podatake iz izvora poput Vikipedije

Podaci se koriste za kreiranje onoga što Meta naziva višejezičnim modelom jezika (MLM), gde AI može da prevodi „bez oslanjanja na podatke na engleskom", navodi se na njihovoj veb stranici.

NLLB tim procenjuje kvalitet svojih prevoda pomoću standarda prevedenih rečenica koje su kreirali, a koje su takođe otvorenog koda.

Ovo uključuje listu "toksičnih" reči ili fraza koje ljudi mogu naučiti softver da filtrira prilikom prevođenja teksta.

Prema njihovom najnovijem dokumentu, NLLB tim je poboljšao tačnost prevoda za 44 odsto u odnosu na njihov prvi model, koji je objavljen 2020.

Kada tehnologija bude u potpunosti implementirana, Meta procenjuje da će biti više od 25 milijardi prevoda svakog dana na Fejsbuk njuz fidu, Instagramu i drugim platformama.

"Razgovarajte sa onima koji poznaju i govore te jezike", kaže Vilijam Lamb, profesor galske etnologije i lingvistike na Univerzitetu u Edinburgu, stručnjak je za škotski gelski, jedan od jezika koje je Meta identifikovala u svom NLLB projektu.

Oko 2,5 odsto stanovništva Škotske, otprilike 130.000 ljudi na popisu iz 2022. kazalo je da ima neko znanje keltskog jezika iz 13. veka.

Takođe ima oko 2.000 govornika galskog jezika u istočnoj Kanadi, gde je on jezik manjine. Unesko ga je klasifikovao kao jezik kome "preti" izumiranje zbog toga što ga malo ljudi svakodnevno govori.

Lamb je primetio da Metini prevodi na ovom jeziku "još nisu baš sasvim dobri", zbog podataka koje koristi program.

"Ono što bi trebalo da urade, ako zaista žele da poboljšaju prevod je da razgovaraju sa ljudima, onima koji govore izvorni galski i koji još uvek žive i dišu taj jezik", rekao je Lamb.

Ali, kako i sam kaže, to je lakše reći nego učiniti jer većina onih koji poznaju taj jezik je u 70-im godinama i ne koristi kompjutere, a mladi govornici "koriste galski po navici, a ne na način na koji to rade njihovi deda ili baka".

Pa iako evidentno još uvek nije savršen, vest o ovom programu je obradovala mnoge jer pre svega oživljava nešto što je svakom ko voli svoju zemlju i narod važno - očuvanje jezika, pisma, običaja, kulture i tradicije.

(M.A./EUpravo zato.rs/Euronews.com)