AktualnościSztuczna inteligencja tłumaczy zapomniane starożytne języki

Sztuczna inteligencja tłumaczy zapomniane starożytne języki

Naukowcy z MIT oraz laboratorium Google AI opracowali system tłumaczenia maszynowego, który pozwala odszyfrowywać zapomniane języki.

Ta historia sięga 1886 roku, kiedy to brytyjski archeolog Arthur Evans natknął się na starożytny kamień z ciekawym zestawem inskrypcji w nieznanym języku. Kamień pochodził z Krety, więc naukowiec natychmiast udał się na śródziemnomorską wyspę, gdzie odkrył wiele kamieni i tabliczek z podobnymi skryptami, pochodzących z ok. 1400 p.n.e. Evans był jednym z niezliczonych naukowców, którzy przez wiele lat próbowali rozszyfrować starożytne języki – jak dotąd bezskutecznie.

Aż do czasu, kiedy do odkodowywania zapomnianych języków nie zabrała się sztuczna inteligencja. Algorytmy zrewolucjonizowały badania nad lingwistyką w ciągu kilku lat, a tłumaczenie maszynowe z jednego języka na inny stało się rutyną. Kluczowym aspektem umożliwiającym tego rodzaju tłumaczenia jest to, że słowa są ze sobą powiązane w podobny sposób, bez względu na język. Umożliwia to mapowanie całego języka na inny język – tłumaczenie zdań staje się procesem znajdowania podobnych trajektorii w przestrzeni. Maszyna nie musi „wiedzieć", co oznaczają zdania, bo proces ten zależy przede wszystkim od dużych zbiorów danych, które można ze sobą w błyskawicznym tempie porównać.

Jak donosi MIT Technology Review, Jiaming Luo i Regina Barzilay z MIT oraz Yuan Cao z laboratorium Google AI w Mountain View w Kalifornii poszli o krok dalej. Oparli się na założeniu, że języki ewoluują w czasie tylko w określony sposób – symbole w językach pokrewnych są tworzone według takich samych wzorców, a powiązane ze sobą słowa mają taką samą kolejność znaków. Stworzenie tych reguł znacznie ograniczyło liczbę operacji wykonywanych przez opracowany przez nich algorytm.

Luo i jego zespół wypróbowali nową metodę na dwóch martwych językach – piśmie linearnym B, który koduje wczesną wersję starożytnej greki oraz ugaryckim. Język ten, odkryty w 1929 roku, odpowiada wczesnej formie języka hebrajskiego. Biorąc pod uwagę informacje i ograniczenia narzucone przez ewolucję językową, algorytm skonstruowany przez naukowców jest w stanie przetłumaczyć oba języki z niezwykłą dokładnością.

Wyzwaniem pozostaje wciąż pismo linearne A – wciąż nie wiadomo, w jakim języku zapisano teksty w linearnym A. Wielką zaletą rozszyfrowywania starożytnych języków przez sztuczną inteligencję jest to, że komputery mogą szybko analizować jeden język po drugim. Jest więc całkiem możliwe, że Luo i spółka mogą poradzić sobie z linearnym A, próbując język za językiem aż do skutku (metodą siłową – ang. brute force).

Zdjęcie: tabliczka z pismem linearnym B z pałacu w Pylos, Wikipedia

Sztuczna inteligencja tłumaczy zapomniane starożytne języki

Wybrane dla Ciebie