Gugl je objavio da je 110 jezika dodato njegovoj funkciji Prevodilac, uključujući nekoliko ugroženih evropskih.
Otprilike četvrtina novih jezika dolazi iz Afrike, saopštila je kompanija, a svi novi jezici predstavljaju više od 614 miliona govornika.
Sada možete da pošaljete mejl na romskom ili manskom, keltskom jeziku ostrva Man koji je "skoro izumro sa smrću svog poslednjeg izvornog govornika 1974.", navodi kompanija u postu na svom blogu.
Regionalni jezici iz Francuske, uključujući bretonski - keltski jezik koji se govori u Bretanji - i okcitanski, koji se govori na jugu zemlje, takođe su na listi.
Dodati su i sicilijanski i venicijanski, dva italijanska dijalekta sa Sicilije i Venecije, kao i severni Sami, jezik koji se govori na severu Skandinavije.
Romski, jezik koji ima mnogo dijalekata i koji govori oko 4,6 miliona ljudi u Evropi, takođe je na listi.
"Naš pristup je bio da damo prioritet najčešće korišćenim varijantama svakog jezika. Na primer, romski je jezik koji ima mnogo dijalekata širom Evrope. Naši modeli proizvode tekst koji je najbliži Južnom Vlaški Romani, koji se često koristi. Ali takođe se meša sa elementima drugih, kao što su severnovlaški i balkanski romski", rekao je Isak Kazvel, softverski inženjer zaposlen u Google-u.
Guglov dugoročni cilj je da "izgradi AI model koji će podržavati 1.000 jezika koji se najviše govore", saopštila je kompanija 2022.
Kako to funkcioniše?
Prevođenje ovih jezika nije tako jednostavno kao što se na prvi pogled čini. Gugl koristi veštačku inteligenciju (AI) za pokretanje funkcije Prevodilac.
Veštačkoj inteligenciji je potrebna dovoljna količina pisanih podataka, kao što su tekstovi iz knjiga, članaka i sajtova.
Ovi podaci zatim "hrane" algoritme inspirisane ljudskim mozgom zvanim neuronske mreže, omogućavajući sistemu da analizira obrasce, kontekst i jezičke strukture kako bi dao prevode koji zvuče prirodno.
Veštačka inteligencija ima tendenciju da radi bolje na engleskom zbog obilja dostupnih podataka na ovom jeziku.
Gugl nije jedina kompanija koja se zainteresovala za retke jezike.
Majkrosoft je 2022. godine pokrenuo Majkrosoft jezičku banku naglašavajući da je 40 odsto svetskih jezika ugroženo, dok je Institut za ugrožene jezike udružio se sa audio kompanijom Shure u kampanji pod nazivom "No Voice Left Behind" da promoviše očuvanje različitih jezika.
(JA/EUpravo zato)