Překladač Googlu začne využívat neuronové sítě

Google Translator dosud používal především statistiku – při této metodě se věty trhají na kratší fráze, u nich se najde, jak již byly přeloženy, a jednotlivé úseky se překládají víceméně zvlášť (tzv. Phrase-Based Machine Translation).
I když samozřejmě počítačové překlady vzbuzují dosud tu a tam úsměv, funguje to překvapivě dobře. Google Translator by dosud de facto (především) verzí systému s překladovou pamětí.

Každý přístup má ale své limity, takže nyní Google do systému zahrnuje i neuronové sítě, které se snaží chápat/překládat věty jako celek. Obě metody se kombinují. Testy na veřejně přístupných sadách dat údajně už dávají slušné výsledky, i když vývoj podobných systémů je vlastně věčný.

Neuronová síť (Google Neural Machine Translation, GNMT) má údajně představovat vylepšení hlavně pro překlady mezi jazyky, které jsou si zcela nepodobné, třeba mezi angličtinou a mandarínskou čínštinou. Google publikoval statistiku kvality překladu podle toho, zda byla použita pouze dosavadní statistická metoda, neuronová síť nad ní nebo i lidský přístup.

Zajímavé je, že třeba pro překlady mezi angličtinou a francouzštinou už lidé nedokázali výsledek strojového překladu prakticky vylepšit (což se posuzovalo tak, že kvalitu hodnotili jiní lidé). Přístup založený na neuronových sítích může ale stále dělat některé chyby. Zmiňují se třeba špatné tvary slov (chybné pády/skloňování) ve výstupním jazyce, nepochopení toho, co jsou vlastní jména, chápání textu na úrovni vět může vést i k chybám vzhledem ke kontextu na úrovni odstavce nebo ještě širšího celku.

Zdroj: TechXplore.com, Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation (ArXiv.org)

Poznámky:

Ze zdroje není jasné, zda dostupný Google Translator už neuronovou síť využívá i standardně a pro překlady mezi češtinou. Aktuálně drobný test: Při automatickém překladu původního textu AJ – ČJ se nevyskytl častý problém, popletení/obrácení záporu.

Google v ČR čelí konkurenci Seznamu, takže se předpokládá, že své služby pro nás optimalizuje více než pro jiné země srovnatelné velikosti. Platí to i pro Google Translator? Nebo jsou naopak překlady z/do češtiny negativně ovlivněny tím, že pro češtinu nemáme dostatečnou bázi frází? Či je to od určitého množství už jedno? Jak vypadá kvalita Google Translator pro češtinu ve srovnání třeba s polštinou?

Překladač Googlu začne využívat neuronové sítě

Související příspěvky

7 z 10 českých firem nepoužívá umělou inteligenci

Altair: stavebnice, která před 50 lety odstartovala vlnu „lidových počítačů“

Trendy pro rok 2025: Co čekat od automatizace a využití IT?

Soukromý cloud versus on-premise systémy

Zprávičky

Přehled hrozeb pro Android: Adware doplnil v listopadu dropper v podobě falešné modifikace pro Roblox

Spor o možný zákaz TikToku jde k Nejvyššímu soudu USA, strany vyslechne v lednu

Severokorejští hackeři mají letos na krádežích kryptoměn podíl 60 %

Sněmovna schválila návrh koalice na odklad digitalizace státu o dva roky

Salvador kvůli dohodě s MMF omezí používání bitcoinu jako oficiální měny

Radiokomunikace získaly rozhodnutí pro stavbu největšího datového centra v ČR

Rusko provedlo kybernetický útok na ukrajinské registry, uvedla vicepremiérka

Správa železnic odkoupila od ČD za 280,1 mil. Kč část firmy ČD-Telematika

Tiskové zprávy

Společnosti Vendavo a Experis Pricing Solutions představují výsledky výzkumu o tvorbě cen v roce 2025

Poslanecká sněmovna schválila novelu zákona o elektronických komunikacích

Spolupráce společností Pure Storage a Kioxia přinese zvýšení škálovatelnosti, efektivity a výkonu v hyperškálových datových centrech

E-shopy jedou naplno, vánoční prodeje potvrzují meziroční růst české e-commerce

Česká obchodní inspekce uskutečnila ve třetím čtvrtletí 148 kontrol internetových obchodů

Huawei přichází s převratnými produkty. Skládací technologie, zvuk a design nabídne v novém světle

Zpráva dne

Jen jednou za rok můžete u na Black Friday získat u Goodoffer24 doživotní lecenci na Windows 11 za €20 a Office za €24!

Videa ITBiz.cz

Komentujeme

Patří datová centra do vesmíru?

Odebírat newsletter

Slovník

Autotypický rastr

Brand

RSI

Kategorie

Píšeme jinde

ScienceMag RSS

AbcLinuxu RSS

Newsletter