A A A

Komputerowy tłumacz

PC Format 03/2015
Dzięki zastosowaniu nowoczesnych algorytmów w tłumaczeniach maszynowych jest coraz mniej błędów. Już niedługo z tej technologii będzie korzystać komunikator Skype program będzie miał moduł, który rozpozna mowę, przetłumaczy oraz wypowie zdania w obcym języku niczym zawodowy tłumacz. BARTŁOMIEJ MROŻEWSKI


Rozwój internetu umożliwił dostęp do informacji na skalę globalną. Jednak co z tego, skoro większość dostępnych treści jest odgrodzona barierą językową? W przypadku międzynarodowej komunikacji problem jest jeszcze bardziej złożony, gdyż wymaga wyższego poziomu umiejętności językowych niż w przypadku korzystania ze źródeł informacji. Można oczywiście korzystać z tłumacza, ale ze względu na koszty z metody tej mogą korzystać głównie firmy i instytucje. Szansą na dostępność tłumaczeń dla reszty ludzi jest zaprzęgnięcie do tej pracy komputerów – dzięki ostatnim osiągnięciom na polu tłumaczenia maszynowego staje się to rozwiązaniem coraz mniej nieprawdopodobnym. Pojawiają się pierwsze programy, które tłumaczą rozmowy w czasie rzeczywistym. Jedną z nich jest Skype Translator, moduł tłumaczenia rozmowy na żywo.

Jak to działa?

Skype Translator, który w chwili pisania tego tekstu wciąż znajdował się w fazie zamkniętych testów, potrafi tłumaczyć rozmowy prowadzone naturalnym, mówionym językiem. Moduł tłumaczący, który bazuje na silniku Microsoft Bing Translatora, rozpoznaje głos, tłumaczy go i syntetyzuje mowę w obcym języku. Jako że algorytm nie zastępuje oryginalnego głosu, lecz dodaje zdanie w obcym języku do wypowiedzi rozmówcy, konwersacja przebiega tak jak przy udziale ludzkiego tłumacza. Obecnie Skype Translator w trybie głosowym tłumaczy tylko rozmowy angielsko-hiszpańskie, ale kolejne języki, w tym polski, mają zostać udostępnione w aplikacji w późniejszym czasie.

Działanie tego systemu jest możliwe między innymi dzięki wykorzystaniu wielopoziomowych sieci neuronowych, które poprawiają skuteczność rozpoznawania głosu, oraz statystycznych metodach tłumaczenia, poprawiających trafność przekładu. Podobnie działają bazujące na zbliżonych technologiach mechanizmy tłumaczenia w programach mobilnych, np. Google Translatorze instalowanym w systemie Android.

Rozpoznawanie mowy

Sieci neuronowe, czyli algorytmy uczące się, swoim zachowaniem przypominają działanie ludzkiego mózgu. Elementy programu, podobnie jak komórki nerwowe, łączą się w sieci, co pozwala na skuteczne rozpoznawanie wzorców i dopasowywanie ich do bazy z próbkami.

Po zarejestrowaniu dźwięku, czyli wypowiadanych przez rozmówcę wyrazów, system tworzy spektrogramy słów. Są one następnie przesyłane do chmury obliczeniowej. Tam algorytmy neuronowe przeprowadzają analizę próbki. Jak to się odbywa? Oprogramowanie rozbija zarejestrowany dźwięk na poszczególne samogłoski i spółgłoski, a potem przepuszcza dane przez kolejne warstwy sieci neuronowej, próbując dopasować dźwięki do słowa. Efektem jest przekształcenie dźwięków na tekst.

Zastosowanie sieci neuronowych pozwoliło zwiększyć skuteczność rozpoznawania mowy do ok. 85 proc. słów wypowiadanych naturalnym językiem. Aby algorytmy neuronowe mogły działać, muszą mieć do dyspozycji rozbudowaną bazę wzorców, czyli nagranych słów wypowiadanych przez różne osoby, które mają charakterystyczny sposób mówienia. Dzięki tej różnorodności nowoczesne systemy rozpoznawania mowy są coraz bardziej tolerancyjne dla języka naturalnego, w którym nieuchronnie pojawiają się błędy i oboczności w wymowie.

Skype Translator ma także dodatkową funkcję, która poprawia jakość konwersji mowy na tekst. Przed przekształceniem wykrywa i kasuje wszystkie dźwięki, które nie są słowami, np. „hmmmm”. Dzięki temu tekst przesyłany do algorytmu tłumaczącego nie jest zaśmiecony, co przekłada się na lepszą jakość maszynowo tłumaczonych treści.

Tłumaczenie tekstu

Maszynowe tłumaczenie tekstu także zostało udoskonalone w ostatnich latach. Wcześniejsze metody, które bazowały na słownikach oraz sztywno zdefiniowanych regułach tłumaczenia, sprawdzały się tylko przy automatycznym tłumaczeniu tekstów pisanych precyzyjnym i przewidywalnym językiem, np. aktów prawnych czy dokumentacji technicznej. Zupełnie nie sprawdzały się w przypadku tekstów mówionych lub pisanych językiem mniej formalnym. Postęp, jaki udało się osiągnąć w rozpoznawaniu mowy przy pomocy sieci neuronowych, tłumaczenie maszynowe zawdzięcza zastosowaniu metody statystycznej.

Polega ona na porównywaniu wpisanego tekstu z wzorcami, którymi są zazwyczaj teksty tłumaczone przez zawodowych tłumaczy. Na tej podstawie algorytm tłumaczący uczy się rozpoznawania i tłumaczenia całych zwrotów i zdań, zamiast pojedynczych, wyrwanych z kontekstu wyrazów. Dzięki temu mechanizm tłumaczący potrafi poprawnie zidentyfikować poprawny sens słów wieloznacznych, takich jak „zamek”, „klucz”, „pilot” czy „mysz”. Zdania z tymi słowami w różnych kontekstach są dobrym testem skuteczności tłumaczenia maszynowego.


Ocena:
Oceń:
Komentarze (1)

Redakcja nie ponosi odpowiedzialności za treść komentarzy. Komentarze wyświetlane są od najnowszych.
avatar
Łotr
2 lipca 2015, 15:50
A ja chciałby dodać, że dzisiaj kupiłem PC Format i idę go oddać z wiadomych względów. Macie dziwaczną modłę wypuszczania nowych numerów.
Najnowsze aktualności


Nie zapomnij o haśle!
21 czerwca 2022
Choć mogą się wydawać mało nowoczesne, hasła to nadal nie tylko jeden z najpopularniejszych sposobów zabezpieczania swoich kont, ale także...


Artykuły z wydań

  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
Zawartość aktualnego numeru

aktualny numer powiększ okładkę Wybrane artykuły z PC Format 1/2022
Przejdź do innych artykułów
płyta powiększ płytę
Załóż konto
Co daje konto w serwisie pcformat.pl?

Po założeniu konta otrzymujesz możliwość oceniania materiałów, uczestnictwa w życiu forum oraz komentowania artykułów i aktualności przy użyciu indywidualnego identyfikatora.

Załóż konto