これは使える!日本と世界のTTS(Text-to-Speech)ナレーターたち
Share
Click here to close
Click here to close
Subscribe here

これは使える!日本と世界のTTS(Text-to-Speech)ナレーターたち

これは使える!日本と世界のTTS(Text-to-Speech)ナレーターたち

ローカライズからボーカライズ:翻訳からナレ録りまで一貫したワークフローで

オーディションでナレーターを決め、録音スタジオも押え、無事に録音完了かと思いきや、原稿に修正が入り、後日その数行を読み直すために同じナレーターを手配しようとするも、数ヶ月先までNG。そんな人間特有の諸事情に振り回されたくないなら、原稿をTTS (Text-to-Speech) に読んでもらうのも賢い選択かもしれません。

[Moravia日本語ブログを無料購読]

特にEラーニングやトレーニング用コンテンツでは、音声による説明が加わることで、ユーザーは画面から目を離して聴きながら作業することも可能となります。生身のナレーターが読み上げるのに約8時間必要とする内容を、速いTTSですと約5分でアウトプットできるといった試算も存在しますので、コスト削減も期待されます。翻訳されたナレーションの場合、元の原稿に入った変更X翻訳言語数の工数がかかりますので、TTSはより柔軟な修正への対応を可能にします。

高品質なボイスが沢山

一昔前までは、どのTTSボイスも「棒読みちゃん」状態でした。しかし、ときは過ぎ、TTSボイスは確実に進歩を遂げました。いまどきのTTSは、機械音ではなく、人の声をベースに合成された音を使う、一歩進んだ音声合成技術なので、より人間のナレーターに近い感覚で聞くことができます。

日本語においては、言うまでも無く、日本国内のTTSプロバイダーが抜きん出ています。たとえば、ソフトバンクのPepper君やマツコロイドにも導入されたAI社のAITalkや、シャープ社のロボホンや「モヤモヤさまぁ~ず」のナレーションで活躍中のHOYAサービス社のVoiceText等があります。ソフトを年間や月額で契約するタイプや、クラウド方サービスなど、そのプロジェクトのニーズに合った使用方法があります。

海外展開を要するコンテンツの場合、多言語対応がしっかりしているかどうかも重要になってきます。多言語対応のAITalk Internationalですと約30言語のTTSが有り、VoiceTextでは9言語がサポートされています。さらに視野を広げてみると、ドイツLinguatecのVoice Readerや、欧州最大手のAcapela Group(ベルギーのBabel、スウェーデンのInfovox、フランスのElan の共同体)などが欧州言語を中心に幅広い言語セレクションを用意しています。

各社、ソフトやサービスの「フルバージョン」では、イントネーションや抑揚の微調整が可能となりますが、この記事でご紹介するボイスは無償でオンラインサンプリングをしたものです。読ませたテキストは、弊社ウェブサイトからの文章で、「デジタル化が進み、コンテンツの作成や発信の方法にも変化が生じています。この動きに乗り遅れないためには、オムニチャネルとマルチメディアに対応したアジャイルなコンテンツを作成し、世の中のスピードにあわせて提供することが必要です。」というもの。数多く視聴させていただいた中から、各カテゴリーのベスト5を、声の自然さや質感を基準に、独断と偏見で決めさせていただきました。

Top 5:日本語女子部門

驚きの結果・・・には程遠い結果でした。やはり日本語力では、国内TTSプロバイダーは他国を寄せ付けません。トップ5の内、4ボイスがVoiceText、1ボイスがAITalkでした。勝敗の決め手は自然で質感のある声で、BGMと共に流した際には「機械」だとバレにくいレベルに思えました。

欧州プロバイダー達も日本語ボイスの用意はありますが、やはり品質面で劣る印象を受けましたし、選択肢も少ないのが現状です。

Top 5:日本語男子部門

偶然ですが、日本語男子ボイスでも、トップ5は女子と同じVoiceTextが4ボイス、AITalkが1ボイスという結果に至りました。音質面でAITalkのオンラインサンプル機能がVoiceTextに劣っているのか、ボイス自体の特性なのか、はっきりとはしませんが、サンプルレベルではほぼVoiceTextに軍配があがりました。

既に気付かれたかと思いますが、これは科学的根拠に基づいた実験結果ではありません。「なんだ、たった一人の意見かい!」と思われるかもしれませんが、実際のTTS導入現場では大いにしてクライアント様の個人的志向に答える必要があり、いくら説得材料を用意しても、最終判断は「好み」に委ねられるケースがほとんど。その点では人間のナレーターを選別する時と違いが無いですね。

Top 5:英語女子部門

それぞれ読ませた文章は弊社ウェブサイト英語版から「The world has gone digital and it’s changed the way content is created and distributed. To keep up, your content has to be agile, omni-channel, multi-media, and quick enough to move at the speed of social.」。

女子の英語ボイス トップ5では、3つが海外プロバイダーから、2つが国内プロバイダーからランキング入りしました。ここで感心したのが、日本の技術の高さです。英語のTTSボイスではアウェーな状況ですが、声の自然さでは引けを取らないのが実情でした。

そしてこんなコラボレーションが実現していました。Top 5入りしたAcapelaのアメリカ英語ボイスSharonは、成田空港で実験中の人型ロボットKokoroさんの声として勤務中。AI社の提供する日本語ボイスと共同で空港案内人としてその実力を発揮しているとのことです。

Kokoro.png

出典: http://www.acapela-group.com/humanoid-assistance-test-kokoro/

Top 5:英語男子部門

女子同様、英語男子でも海外勢が強いです。しかし、トップ5の内2つにVoiceTextが食い込んできたことも確かで、賞賛すべきところ。日本語コンテンツを英語に訳した直後に「ナレ録り」をしてしまうというのも、もはや現実ですね。そして、言語によってはなかなかナレーターの手配が困難な場合もあります。そんな時のバックアッププランとしてTTSは有効でしょう。

その他の可能性

TTSプロバイダーの中にはオンラインサンプリング機能を持ち合わせていないものもあります。例えば、 BalabolkaAudioBookMakerNaturalReader (ここはサンプリングも可)は、フリーソフトをPCにダウンロードした上で使用が可能です。

プロジェクトの音声ニーズによっては、思いっきりIBM WatsonAmazon Pollyにお願いするという選択肢もあるでしょう。

各社さまざまなサービスを提供していますし、オンラインでの情報収集も容易なので、御社の用途に合ったTTSソリューションが必ず見つかるはずです。英語になりますが、elearningindustry.comによるブログ記事を参照するのも良いかもしれません。

ななんと、こんなことも

Acapelaの何がスゴイかと言いますと、やはり圧倒的なボイスセレクションでしょう。例えばエリザベス女王陛下にナレーションを読んでもらうのはいかがでしょうか?現実にはありえないこともTTSなら可能になります。

また、AITalkやVoiceTextでも、オリジナルボイスの作成や、(アニメ等の)キャラクターボイスを使って幅広い用途にTTSを活用することが可能です。「読む」だけでなく、「歌う」ボイスもあります。VoiceTextの「音声合成の声優事務所」には台詞を読んだり歌を歌ったりできるつわもの達がそろっている一方で、AH-SoftwareのVOICEROID+ではAITalkを採用した話声合成とVOCALOIDによる歌声合成が同じボイスで可能となっています。Text-to-Song分野で圧倒的優位に立っている日本ですが、VOCALOIDやUTAUも もちろん英語に対応しています。

TTSボイスは風邪を引くこともありませんし、里帰りもしません。そんなText-to-SpeechやText-to-Song技術を、Eラーニング、トレーニング、プロモーション活動の「ローカライズからボーカライズ」ソリューションとして活用してみてはいかがでしょう。

 


 [編集メモ:この記事は、2017年3月に投稿した内容に加筆・訂正したものです。ダグラス・マクゴワンよる元の記事はこちらからご覧いただけます。] [i/i]

 

Comments