時として頓珍漢ぶりを発揮するニューラル機械翻訳
Share
Click here to close
Click here to close
Subscribe here

時として頓珍漢ぶりを発揮するニューラル機械翻訳

時として頓珍漢ぶりを発揮するニューラル機械翻訳

人工知能(AI)を使ったニューラル機械翻訳(NMT)。昨年の11月から、誰もが使ったことがあるGoogle翻訳もその仲間入りをしました。単語単位ではなく、文章単位で翻訳することから、「より流暢で人間による翻訳に近い」というのが売り文句となっています。そして、その流暢さにこそ落とし穴が潜んでいます。

[Moravia日本語ブログを無料購読]

 今回の投稿では、この問題について徹底的に分析するわけではなく、衝撃的な裏情報を暴露するわけでもなく、たった1つの例を一緒に見ていくことにしました。ぜひ、気軽にお読みください。

 

一見良さげに見えるものの・・・

最近、下記の文章をGoogle翻訳にかける機会がありました。

For these products, please use 視覚化 not 可視化 based on the definition at the following URL:

これは翻訳者向けの指示で、文章の意味合いに応じて「視覚化」と「可視化」を使い分けてください、といった内容です。ただ、その翻訳結果があまりにも興味深く、紹介させていただきたいと思ったのです。

ニューラル化したGoogle翻訳が出力したのは・・・

Google translate result 1

視覚障害?どこからそんなのが出てきたのでしょうか?視覚障害を避けろと言われても困りますが、その反面、肝心要の「視覚化」も「可視化」も、鳴りを潜めてしまっています。内容は極めて不適切ですが、同時に滑らかで流暢なので、通常の「機械翻訳っぽさ」が感じられません。その分、危険です。英文、和文、ともに理解している人がチェックしないと、とんでもない翻訳を世に出すことになってしまいます。

何ゆえにこんな不思議なことが起こるのでしょうか?まさか、文末のコロン(:)が予測不可能な問題を引き起こしているとでも?ということで、(:)を( . )に変えてみました。その結果・・・

Google translate result 2

「視覚障害がないことを確認」するように言われました。どうしても視覚障害から離れられないようです。(恐るべし、人工知能の思い込み。)

工夫すれば使える・・・はず

機械翻訳 エンジンが、ソーステキストの英文に埋もれている日本語を「別物」と認識できずに難儀しているようですね。なので、[  ] で、はっきりと区別することにしました。これでどうでしょう。

Google translate result 3

「視覚障害」は消えました。「視覚化」も、そのまま「視覚化」になっています。これにて一件落着と思いきや、「可視化」までもが「視覚化」に書き換えられています。不思議が不思議を呼ぶパターンです。これは日本語の「可視化」をそのままスルーするのではなく、一旦「視覚化」と同じ「visualization」に 訳した上で再度日本語に戻している、ということでしょうか?「小さな親切、大きなお世話」という感じがします。

この翻訳も、流暢ですからなおさら「[視覚化]ではなく[視覚化]を使用してください」と言われて、「おいおい」とツッコミ返したくなります。

結局最後まで「視覚化」は「視覚化」、「可視化」は「可視化」として扱ってもらえず、まるで陣内智則さんのネタを見ているような三段オチが成立してしまいました。

ニューラルを考え直す?

納得のいかないニューラル機械翻訳の結果を受け、少し前までお世話になっていた統計機械翻訳に目を向けました。実はそんなに悪くなかったのかな・・・悪い思い出は気のせいだったのかな・・・と、ほぼ自己暗示にかかった状態で同じ文章を訳させました。

http://honyaku.yahoo.co.jp/の場合:

Yahoo translate example

「視覚化」、「可視化」に関しては完璧。しかし、もやもやとした記憶が戻ってきました。ニューラル以前の、理解に苦しむ、あの感覚が。利用者を「喜ばせる」ことは無理のようです。

http://www.excite.co.jp/world/english_japanese/の場合:

Excite translate result

これも「視覚化」と「可視化」は良しとして、「not」が訳されずに放置されているのはnot good ですね。Re-translateするとURLをフルスペルのUniform Resource Locatorにしてくれる過剰サービスでありながら、和訳自体には限界を感じます。

ニューラル機械翻訳の注意点

Amazon の機械翻訳研究開発グループ長を務めるAlon Lavie氏曰く、ニューラル機械翻訳は、単語や語順において、ソース言語とターゲット言語のマッチングに基づく技術ではないので、時として奇妙な翻訳をするそうです。しかし、その奇妙さが流暢さに埋もれてしまう危険性もあります。使用には注意が必要です。

ニューラル機械翻訳についてより詳しく知りたい方は、ポッドキャストGlobally Speaking(英語)の特集を聴いてみませんか?通勤時にイングリッシュシャワーを浴びながら、NMTエキスパートになれるかもしれません。

Podcast Part 1: NMTと従来の機械翻訳の違いについてディスカッション

Podcast Part 2: NMTの革新的要素と可能性についてディスカッション

Podcast Part 3: NMTが翻訳業界に与える影響についてディスカッション

Globally Speaking Radio


編集メモ:ダグラス・マクゴワンによる、この記事の英語版は、こちらからご覧いただけます

 

Comments