中国の検索大手・百度が開発したスマート翻訳機が今月21日に日本に上陸した。名古屋の観光スポットから最も便利な交通ルートまで、翻訳機は流暢かつ正確な中国語と日本語の双方向翻訳で人々を驚嘆させた。人工知能(AI)翻訳サービスはハードとソフトウェアを通じて様々な対話シーンを繋ぎ、言葉が通じないという問題を解決しようとしている。なかにはAI翻訳は翻訳者を「抹殺する者」になりうると考える人すらいるほどだが、現実はどうなのだろうか?
▽現状:翻訳機は多いが、精度の向上が望まれるレベル
2017年はAIが大躍進した1年と言えるだろう。科学技術のトレンドとして、グーグルやアップルだけでなく、百度やアリババも人工知能の製品を相次いで発表し、スマート業界に勢いよく進出している。なかでも「AI翻訳」はインターネットの大手企業のほとんどが進出したいと考えている分野となっている。
海外では、マイクロソフトが9種類の言語をリアルタイムで文字テキストに翻訳する「Microsoft Translator」という翻訳アプリを発表した。中国国内では、百度翻訳が全世界の28種類の言語の双方向翻訳と756分野に対応している。テンセントのリアルタイム音声通訳アプリ「翻訳君」は、AIカーネルをドライバとして、音声認識やNMT(ニューラルネットワーク)などの技術を用いて、「同時通訳」機能を実現している。
AI翻訳が急速な進展を見せているが、オーソドックスな翻訳業界からは認められているとはいいがたい。伝神語聯網絡科技股フン有限公司(フンはにんべんに分)の何恩培董事長は、「翻訳機にしても、アプリにしても、中国語を英語または他の言語に翻訳する場合の精度はまあまあだが、外国人が話す英語やその他言語を中国語に翻訳した場合の精度は低く、実際のコミュニケーションにはほとんど役に立たない」としている。
▽難点:データ不足で言語の仕組みは不文律
世界において国際会議や発表会などに用いられる30種類以上の翻訳機は、一部のシーンにおける言葉の交流問題を解決しており、その現状として翻訳機はすでに非常に大きな進歩を遂げたものの、一方で、高いレベルの翻訳が目指すところの「信頼性と老練さ、品の良さ」といった点ではまだまだ大きな隔たりが存在している。
囲碁界を制覇している人工知能・AlphaGoはなぜ翻訳分野においてはその完璧な力を発揮できていないのかという点について、何氏は、「人工知能の分野において、翻訳機が最も難しい課題の一つだというのは周知の事実。囲碁と異なり、言語にはその背後には多元的な文化や複雑な社会的属性が含まれているので、その仕組みを規則化するのは不可能なことだ」と話す。
また、AI翻訳が「信頼性と老練さ、品の良さ」という高い要求を満たそうとした場合、話し言葉における二つの難題を克服しなければならない。一つは発言者の発音や切れ目を正しく判断し、しかもごく短時間のうちに「発音の区切り」を判断しなければならない。もう一つは話し言葉特有の文法の乱れや文脈の一貫性の無さ、センテンスの切れ目がはっきりしていないといった問題を解決しなければならない。
翻訳機がどのようにしてこのような問題を解決するのかという点について、清華大学計算機学部の劉洋副研究員は、「AI翻訳機の難点はいかに機械に人間と同じようにスマートな行動をさせるかという点だ」としている。彼は翻訳機はデータをドライバとしているので、その精度はデータによって決まるとしている。現在、翻訳データの多くは政府機関の書類であり、スポーツやエンターテイメントなどの分野に関するデータがほとんどない。それに加えて、各国の話し言葉にはくだけた表現やネット用語も多用されるので、AI翻訳は膨大な基礎語彙のデータベースのサポートを必要とする。
▽展望:データでAI翻訳の進展を推進
近年、ニューラルネットワーク(Neural Machine Translation, NMT)の技術によって、翻訳の応用がさらなる進歩を遂げた。NMTは脳の思考モデルを模倣しており、翻訳者と肩を並べるほどの高水準の翻訳文を作成できるようになっているのと同時に、その誤差を55%~85%にまで下げている。
また、言語処理や対話型言語などの技術の進歩は翻訳製品のバージョンアップを加速させ、コンピューター支援翻訳(CAT,Computer Aided Translation)から人工知能インタラクティブ翻訳への転換を促している。
清華大学計算機学部の教授は、「世界には数千種類の言語がある。大部分の言語同士の間の言語資料が不足している。そのため、言語モジュールの構築など言語資料の翻訳をする必要がある」としている。
AI翻訳は複合学科であり、数学や言語学、コンピューター科学、神経認識科学など多方面の進展にかかっている。そのため、AI翻訳はより多くの分野と一緒になって、データによる翻訳機の発展を促すべきだ。また、コンピューターに婉曲な言い回しや不規則な話し方を理解させるには、まだかなり長い時間を必要とするだろうとみられている。(編集HQ)
「人民網日本語版」2017年9月27日
このウェブサイトの著作権は人民日報社にあります。
掲載された記事、写真の無断転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn