機械学習で翻訳のニーズは予測できるか

機械学習で翻訳のニーズは予測できるか

機械学習で翻訳のニーズは予測できるか

Machine_Learning_and_Localization.jpg

アメリカのラジオ局NPRで放送された「Uberがピーク料金の廃止を計画、ドライバーのやる気にブレーキ?」というニュースで、Uberのエンジニアリングチームを率いるジェフ・シュナイダー氏は、同社が機械学習を活用して需要と供給のギャップを埋めようとしていることを明かしています。

[Moravia日本語ブログを無料購読]

これまでUberは、特定の時間帯に需要が集中する問題を解決するため、割増料金制を適用してきました。「ピーク料金」と呼ばれるこの制度では、たとえばイベント時など、特定地域で同時間帯に需要が集中すると料金が自動的に引き上げられます。高需要の時間帯、地域に多くのドライバーを誘導し、需給バランスを調整することを目的とした取り組みで、ピーク料金について」というヘルプ項目で、Uberは次のように説明しています。

“多くのお客様の需要が重なる場合(悪天候の日、スポーツの試合後、大晦日など)にも、信頼できるご乗車を保証するために、料金は変動いたします。こうしたピーク時間帯のための割増料金を、Uberではピーク料金と呼んでいます。
ピーク料金には、主に二つの効果があります。お客様にとっては、数分待つか、他の移動手段を選ぶのかお選びいただくことになりますので、当該エリアの過剰な需要を下げることができます。次に、ドライバーにとっては、割増された料金によって需要の高い当該エリアでの業務を推奨されることに繋がります。需要が通常レベルまで戻ると、料金も通常に戻ります。”

しかし、Uberはピーク料金を一時的な解決策ととらえており、需要と供給のギャップは、より詳細なデータと機械学習、予測モデルを用いることで解決できるとしています。具体的には、乗客の行動や環境要因などのデータを収集して機械学習アルゴリズムに入力し、需要が急増する場所や時間を特定するという方法です。これにより、いつ、どこにいれば稼げるかという情報をドライバーに提供できるようになり、結果としてピーク料金を適用する必要はなくなるというのがUberの見解です。

Machine_Learning_Uber_Surcharge.jpg

機械学習で需要を予測し、ピーク料金を回避(写真:iStock

 

機械学習でローカリゼーションもスマートに?

需要と供給のバランスはあらゆるビジネスの永遠のテーマであり、もちろんローカリゼーション業界も例外ではありません。翻訳の送り手は翻訳者、受け手は製品やサービスを利用する消費者やエンドユーザーであることが多いわけですが、ここではランゲージサービスプロバイダー(LSP)を供給側、実際に翻訳サービスにお金を支払う顧客企業を需要側として話を進めていきましょう。

多くのLSPではすでに、クラウドソーシング翻訳メモリ(TM、機械翻訳(MT)などを駆使して、従来と同じリソースでより多くの業務をこなせるよう工夫しています。また、複数のプロジェクトを並行して管理し、リソースを共有することで需要の波を吸収できるように努めているところもあります。

こうした努力をするとともに、すべてのLSPでは、供給が追いつかないということのないよう、できるだけ正確に需要を予測しようとしています。ただし、事前にどれだけのニーズが生じるかを100%予見することは、ベテランのプロジェクトマネージャーにも難しいものです。人は経験にもとづいて予測を立てますが、トレンドを正しく見極めるのに必要な情報のすべてを記憶しておくことはできないからです。

 

予測で可能になること

そこで頼りになるのが機械学習です。必要なすべてのデータポイント(プロジェクト数、ワード数、所要時間、品質要件、対応言語数、開発サイクルの段階、リリース日、天候、祝日、キャパシティなどの情報)をアルゴリズムに入力して、いつ、どこで需要のピークが生じるのかを予測できるとしたら、どうなるでしょうか?

私の知る限り、ローカリゼーション業界で機械学習テクノロジーが活用された事例はまだありません。需要の予測が実現することで、LSPの業務にどのような変化が起こり得るのか、価格設定や納期にはどのような影響が及ぶのかはまったくの未知数です。それでも、たとえ実現の可能性がごくわずかだとしても、実現したら…と想像せずにはいられない魅力的な考えであることは間違いありません。

需要と供給のバランスを取ること以外にも、予測が役に立つ領域はまだまだありそうです。たとえば、どのようなコンテンツがローカライズしにくいか(結果として高くつくか)、逆にどのようなコンテンツがローカライズしやすいか(コストが抑えられるか)、翻訳者やポストエディターにとってTMやMTが有効(または逆効果)なのはどのようなコンテンツかなど、事前に知ることができればどれだけのメリットがあるでしょう?

 

機械学習を夢物語にしないために

このような予測は、現状のワークフローに大きな変化をもたらす可能性があります。LSPは必要なリソースを必要なプロジェクトに適時に割り当てられるようになり、顧客企業はローカリゼーション予算と市場投入期間を適切に管理できるようになるでしょう。

さらに、ローカリゼーションチームは、ローカライズしやすい(低コスト)コンテンツとローカライズしにくい(高コスト)コンテンツの特徴を把握し、コンテンツ作成のワークフロー上流にいるライターと共有することで、はじめから「翻訳に適した」ソースコンテンツを作成するという、ローカリゼーション業界にとってこれ以上ない合理化も夢ではなくなるのです。

ただし、機械学習は魔法ではなく、あくまでもツールです。素人が安易に手を出しても、それなりの結果しか得ることはできません。Uberなどの輸送業をはじめ、多くの業界はこのことを理解したうえで、ビジネスに上手く取り入れようとしています。

機械学習は強力なツールですが、これを上手に使いこなして大きな力を発揮させるには、使う側にも賢さが求められます。機械学習にできること、制約、メリットとデメリットをよく理解し、予測に必要な適切なデータを集めることも必要です。そして、実はなにより重要なのは、「何が知りたいのか」を私たち自身がちゃんとわかっていることだったりします。

 

[この投稿はTAUSブログでも紹介されました。]

[アダム・ラモンテーン による原文へ] [編集: MLS] [o/o-i]

 

Comments