機械翻訳入門

一貫性と品質を保つために必要なこととは?

機械翻訳 (MT) には長い歴史があり、最初に導入されたのは1950年代です。現在の自動翻訳は人工知能テクノロジーを取り入れたことでかつてないほど改善されています。とはいえ、これはMTがあらゆる種類の資料の翻訳に適しているということではありません。機械翻訳された訳文は、現在でもほとんどの場合、一貫性と品質を保つために翻訳者による事後編集(ポストエディット)が必要です。

機械翻訳のポストエディット(MTPE)が必要な場合

機械翻訳は専門的な内容を扱う分野、特に、法律、医療、科学などに最適です。こうした分野の内容は、傾向として定形の構造、限定的なセマンティックドメイン[1]、言語パターンの反復など、MT変換の効率と精度に寄与するあらゆる要素を備えています。対照的に、創作的な文章の場合、機械翻訳では意味合いやニュアンスの微妙な差や、文脈が認識されないため逐語訳になってしまいます。

非推奨
推奨

マーケティング資料

ニュース記事

字幕

キャッチコピー

製品説明

レシピ

住所

取扱説明書

医療記録・カルテ

契約書

天気予報

当然ながら、言語ペアも考慮に入れるべきです。というのも、MTは一般的な言語ペアの翻訳のほうが得意で、トランスレーションメモリを使用できる場合には特に成果が上がるからです。

構文や文法構造が異なる言語間のMTでは、翻訳結果で思わぬ言い回しを目にすることがよくあります。

スウェーデン語
ポルトガル語
ドイツ語
原文
私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか? 私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか? 私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか?
翻訳※
Vi har några tankar och bilder om havet som orsakade livets födelse. Men i praktiken, vad vet du om havet? Temos alguns pensamentos e imagens sobre o mar que provocaram o nascimento da vida. Mas na prática, o que você sabe sobre o mar? Wir haben einige Gedanken und Bilder über das Meer, die zur Geburt des Lebens geführt haben. Aber was wissen Sie in der Praxis über das Meer?
折り返し翻訳※
私たちは生命の誕生を引き起こした海についていくつかの考えや写真を持っています。 しかし実際には、あなたは海について何を知っていますか? 私たちは生命の誕生をもたらした海についていくつかの考えやイメージを持っています。 しかし実際には、あなたは海について何を知っていますか? 私たちは生命の誕生につながった海についていくつかの考えや写真を持っています。 しかし、実際に海について何を知っていますか?

※Google API 翻訳

韓国語
タイ語
ベトナム語
原文
私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか? 私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか? 私たちは、生命の誕生をもたらした海に対して、何らかの思いやイメージを抱いている。だが実際には、海について何をどれくらい知っているだろうか?
翻訳※
우리는 생명의 탄생을 가져왔다 바다에 대해 어떤 생각이나 이미지를 안고있다. 하지만 실제로는 바다에 대해 무엇을 얼마나 알고 있을까? เรามีความคิดและภาพเกี่ยวกับทะเลที่นำมาซึ่งการกำเนิดของชีวิต แต่ในทางปฏิบัติคุณรู้อะไรเกี่ยวกับทะเล Chúng tôi có một số suy nghĩ và hình ảnh về biển mang lại sự ra đời của cuộc sống. Nhưng trong thực tế, bạn biết gì về biển?
折り返し翻訳※
私たちは、生命の誕生をもたらした海についての考えやイメージを抱いている。しかし、実際には、海に何をどのくらい知っているか? 私たちは生命の誕生をもたらす海についての考えやイメージを持っています。しかし実際には、海については知っていますか 私たちは生命の誕生をもたらす海についての考えやイメージを持っています。しかし、実際には、あなたは海について何を知っていますか?

※Google API 翻訳

原文
東京の夏の楽しみといえば、祭りや花火大会などのイベントにかき氷を食べたり、ビーチへ出かけたり、ビアガーデンで仲間と飲み明かしたり、木陰のある公園を散策したりと青空の下で過ごす時間を楽しみましょう。博物館やデパートなど、涼しい屋内で一息つくのもおすすめです。
英訳*
Speaking of summer fun in Tokyo, you can eat iced ice for events such as festivals and fireworks displays, go out to the beach, drink with friends in a beer garden, take a walk in a shady park, and spend time under blue sky Let’s do it. It is also recommended to take a breather in cool indoors such as museums and department stores.
折り返し翻訳※
東京での夏のお楽しみといえば、お祭りや花火大会などのイベントのためにアイスアイスを食べたり、ビーチに出かけたり、ビアガーデンで友達と飲んだり、日陰の公園で散歩したり、青空の下で時間を過ごしましょうやりなさい。美術館やデパートなどの涼しい屋内で一息つくこともお勧めです。

※Google API 翻訳

上記の例と次の例を比較してみてください。原文は意味が明確になるように編集し、訳文は読みやすさを考えて翻訳者が手を入れています。こうした手順を加えたことによって最終的な翻訳はかなり自然な感じに仕上がっています。

原文
東京の夏の楽しみといえば、祭りや花火大会などのイベント。また、かき氷を食べたり、ビーチへ出かけたり、ビアガーデンで仲間と飲み明かしたり、木陰のある公園を散策したりと、青空の下で過ごす時間を楽しみましょう。博物館やデパートなど、涼しい屋内で一息つくのもおすすめです。
英訳※
Speaking of summer fun in Tokyo, events such as festivals and fireworks displays. In addition, enjoy iced ice, go to the beach, drink with friends in the beer garden, stroll through the shady park, and spend time under the blue sky. It is also recommended to take a breather in cool indoors such as museums and department stores.
MTPE
When speaking of summer fun in Tokyo, events such as festivals and fireworks displays come to mind. In addition, enjoy shaved ice, go to the beach, drink with friends in a beer garden, stroll through a shady park, and spend time under the blue skies. It is also recommended to take a breather in cool indoors such as museums and department stores.
折り返翻訳
東京の夏のお楽しみといえば、祭りや花火大会などのイベントが頭に浮かびます。また、かき氷を楽しんだり、ビーチに行ったり、ビアガーデンで友達と飲んだり、日陰の公園を散歩したり、青い空の下で過ごしたりしましょう。美術館やデパートなどの涼しい屋内で一息つくこともお勧めです。

※Google API 翻訳

機械翻訳に期待できること

機械翻訳は完璧には程遠く、まして「そのまま使用できる状態にある」とは言えません。データに依存するすべてのソフトウェアと同様に、対象の内容を上手に翻訳させるには、調整とトレーニングが必要です。前述したように、機械翻訳の品質は、a) 内容が機械翻訳向きであることだけでなく、b) 翻訳前の下準備を十分に行なっているかどうかにも大きく左右されることを理解する必要があります。また、機械翻訳では、用語集やトランスレーションメモリーなどのツールを活用して効率を上げることも必要です。

MTPE 事前チェックリスト

ポストエディットは機械翻訳の訳文を微調整するのに役立ちますが、訳文の質によっては翻訳者が最初から訳すのと同じぐらい時間がかかる場合もあるのが実情です。でも、ご安心ください。MTの訳文の質を上げ、ポストエディットにかける時間を節約できる手順があります。次のチェックリストを参考に、次回のMTプロジェクトを円滑に進めるためにできることを検討してみてください。

  • 内容の確認
    どの程度専門的な内容かを判断します。文章が明確で簡潔であることを確認します。
  • 言語ペアの評価
    構文や語彙が似ている一般的な言語ペア(英語とフランス語のペアなど)のほうが翻訳結果は良好です。
  • 用語集の作成
    適切な名詞と業界用語を特定します。可能な場合は派生的な語句も用語集に追加します (例: 機能、機能的、主要機能、標準機能)。
  • 一貫性の確認
    主要な用語が用語集と一致しており、ファイル全体で一貫して使用されていることを確認します(例:用語が「国際線」の場合、ファイル内で「国際線」が一貫して使用されており、「海外便」や「国際便」などの類語が使用されていないことを確認します)。
  • リライト、削除、再構成
    必要に応じて思い切って文を短くしたり、不要な表現を削除したりします。
  • 経験豊富な専門家に依頼
    ポストエディターがMTプロセスをよく知っていることを確認します。

[1] セマンティックドメインとは、特定の分野を論じるために使用される意味と単語の領域です。例えば、「乗り物」ドメインには、乗用車、トラック、タンク、道路、モーター、ガソリン、輸送などの単語を含めることができます。