品質評価フレームワークを構築するための5つの手順
Share
Click here to close
Click here to close
Subscribe here

品質評価フレームワークを構築するための5つの手順

品質評価フレームワークを構築するための5つの手順

品質評価フレームワークを構築するための5つの手順

翻訳の品質と一言でいっても、考え方は人ぞれぞれ。評価を5人に依頼すれば、おそらく5通りの結果が返ってくるでしょう。

とはいえ、主観に頼ってしまっては、個人の好みですべてが決まってしまいます。何をもって「良し」とするのか、関係者の間でなかなか合意を得られず、結局エンドユーザーに「良い翻訳」を届けられないことになっては意味がありません。重要なのは、求められる品質を定義したうえで、体系立てて評価することです。

[Moravia日本語ブログを無料購読]

このテーマについては、先日のTAUSウェビナー「Quality is Communication」で、Moraviaのランゲージサービスディレクター、Katerina Gasovaがお話をしました。ウェビナーでは、翻訳の品質管理を行うためのフレームワークを構築すべき理由とその方法をお伝えしています。今回のブログでは、翻訳品質の評価に役立つヒントとテクニックをご紹介します。

コンテンツの種類に応じた品質レベル

翻訳対象となるコンテンツはさまざまです。ウェブサイトから技術者向けのユーザーマニュアル、オンラインヘルプや製品レビューまで多岐にわたります。では、各コンテンツに求められる品質について、関係者間で合意は得られているでしょうか。 品質要件がコンテンツの種類ごとに異なることは、ついつい見落としがちなポイントです。コンテンツの目的と重要度に応じて翻訳品質の適正レベルを見極めることは、予算とスケジュールを最適化することにもつながります。

たとえば、保守マニュアルに、ウェブページのような翻訳品質が求められることは、まずありません。多くの人の目に留まることを目的とするマーケティング資料には訴求力が必要ですが、製品ナレッジベースのような技術文書は要点がわかれば十分、ということです。

コンテンツを種類ごとに分類し、それぞれに期待される品質レベルについて検討してみましょう。たとえば、以下のような定義が考えられます。

  • 高品質: 文法、用語、読みやすさのいずれも問題がない翻訳。原文の意図を正しく解釈し、慣用句やユーモアなど地域ごとに異なる要素は適切に置き換えます。原文のトーンを考慮した文体を選ぶ必要があります。
  • 標準: 内容が正確で、文法も正しい翻訳。ただし、読みやすさについては必ずしも完璧である必要はなく、用語についても軽微な不統一が見られるかもしれません。
  • 基本: 読んで理解でき、曖昧なところがない翻訳。文法、読みやすさ、用語に問題があったとしても、内容が伝わる限りにおいて重大なエラーとは見なされません。

コンテンツの種類に応じた品質レベルの定義ができたら、次は品質管理を実施するためのフレームワークを作成します。このフレームワークには、5つの要素があります。

1. エラータイプ

翻訳で見つかった誤りがどのようなものかを理解するために、エラータイプを定義します。一般的なエラータイプとしては、正確さ、読みやすさ、表記、文法、用語、国別の基準、顧客固有の要件などがあります。SAE J2450やTAUSのDQF/MQMなど、既存の業界標準に従うのも一案です。

主要なエラータイプを決めるだけでなく、サブカテゴリーも定義しておくと便利です。原文にない要素のつけ足しまたは削除、訳もれ、TM候補の流用ミス、日付書式の誤り、句読点、誤字脱字など。こうしたサブカテゴリーがあれば、エラータイプを詳細に分析して、問題の根本原因を特定するのに役立ちます。たとえば、用語集が最新版ではなかった、翻訳者のスキル不足だった、原文に問題があり正確に訳すことが困難だった、などの原因が考えられます。

2. エラーの重大度

エラータイプを決めたら、次は重大度を定義します。エラーは、「致命的」、「重度」、「軽度」などに分類できます。この段階で検討するのは、コンテキストに合わせて判断した場合のエラーの影響度です。たとえば、ユーザーが必要な操作を実行するのに支障があるレベルのエラーか。 製品の製造元に法的な責任が生じるほどのエラーか。 そうであれば、「致命的」に該当するでしょう。そこまでではない場合、たとえば引用符の前後に不要なスペースがあるくらいであれば、「軽度」のエラーに分類できます。

好みが入る評価や、2回目以降のエラーについても重大度を定義しておくとよいでしょう。重大度としては、軽度に分類するか、1から10のスケールでゼロとするのが一般的です。ただし、何度も繰り返される問題については、重大度を高くすることも検討します。

3. エラーの重み

エラータイプと重大度を決めたら、次はそれぞれに重みを割り当てます。重みは数値、たとえば1か5の倍数として表します。レビューアーが、あるエラーを「正確さ」で「重度」と分類した場合、重みを5とします。同じレビューアーが、別のエラーを「用語」で「軽度」と分類したら、重みを1と指定します。各タイプと重大度について報告されたポイントを集計すると、スコアが得られます。

4. 合否のしきい値

続いて、許容範囲となるスコアを決めます。しきい値は、一定の単語数(通常は500ワードか1,000ワード)あたりで許容されるエラーの個数が基準になります。

たとえば、ユーザーマニュアルであれば1,000ワードあたり10個のエラーで不合格とします。広告コピーだったら、1,000ワードあたりでもエラーはゼロでないと合格にはできないかもしれません。

いよいよ、最後のステップです。

5. 評価フォームの作成

最後に、レビューアーが使うフォームを作成します。できれば、翻訳支援(CAT)ツールのプラグインをQAデータベースに接続するだけでフォームが作成されるのが理想的です。データをテンプレートに抽出すると、スコアカード(Excelファイルが一般的です)が自動的に作成されるようにしておきます。あとは、レビューアーが各エラーのタイプと重大度を決めるだけです。ワード数ごとの許容エラー数が式で計算され、各エラーとその重大度に応じてポイントが割り当てられます。そして最終的に、翻訳品質の合否が決定されます。

 

翻訳品質の客観的な評価に、近道はありません。コンテンツの種類に応じて必要な品質レベルを決め、エラーを定義するためのしくみを作る必要があります。このしくみができれば、何が要修正で、何が修正不要かを判断するためのパターンが見えてくるまで、それほど時間はかかりません。どの翻訳者が一定の品質を達成できているのかも、見えてくるでしょう。


 [編集メモ:この記事は、2017年5月に投稿した内容に加筆・訂正したものです。リー・デンズマー による元の記事はこちらからご覧いただけます。] [編集: MLS] [o/i]

 

Comments