2022 年 12月 26 日
複数の翻訳エンジンを比較 - 機械翻訳を活用してより良い訳文に -
グローバル化が進む昨今、社内文書や社外文書の翻訳が必要になる機会が増えています。例えばニュースリリースやIR資料など、日本語以外の言語でも公開できればもちろん良いのは分かっているけれど、そこに割けるリソースがない…といった方もいるのではないでしょうか。
近年精度が飛躍的に向上しているAI自動翻訳ですが、世の中にはたくさんのエンジンが存在しています。一番よく知られているエンジンはやはりGoogle翻訳でしょうか?しかし、エンジンはこれがいい!あれがいい!という話ではなく、用途や状況に応じて使い分けることが大切です。
本記事では複数のエンジンの訳出結果を比較し、その違いや特徴を見ていきます。
ヤラクゼンで使えるエンジン
弊社開発の翻訳プラットフォーム『ヤラクゼン』では、複数のエンジンが使用できます。
- Google Translate
米グーグル社が開発する翻訳エンジン。世界トップレベルの翻訳品質・スピードを達成しています。
- Microsoft Translator
米マイクロソフト社が開発する翻訳エンジン。
- Yaraku Translate β
大規模なパブリック コーパスでトレーニングされたオープンソースモデルに基づく堅牢なエンジン。 自社施工・自社管理。
- みんなの自動翻訳@KI
国立研究開発法人 情報通信機構(NICT)が開発する翻訳エンジン。 汎用版の他に特許版、金融版(IR/適時開示・サービス)、法令契約版、サイエンス版がある。
(ヤラクゼン無料ユーザーが使用できるエンジンは「Yaraku Translate β」のみです。また、有償オプションで「みんなの自動翻訳@TexTra®」も利用できます。対応言語はこちらからご確認ください。)
以上がヤラクゼン上で使用できるエンジンです。本記事では、様々な特性を持つ各エンジンの訳出結果にはどのような違いがあるのか、例を用いて比較してみようと思います。
実際に各エンジンの訳出結果を比較
今回は次のようなニュースレターを英語に翻訳しました。
このニュースレターの翻訳について、各エンジンが異なる訳文を出力した例をご紹介します。
※2022年10月時点、ヤラクゼン上での訳出結果です。
1. Microsoftが元の日本語に忠実な訳出をしている例
Microsoftのエンジンでは、他エンジンが落としている細かい情報も落とさずに訳文に反映している箇所がありました。
「『プリエディット・ポストエディット』丸わかりセミナー」という、弊社で開催したセミナーの名前に対する訳文です。
原文 | 『プリエディット・ポストエディット』丸わかりセミナー |
Microsoft | "Pre-Edit Post-Editing" Full Understanding Seminar |
"Pre-editing/Post-editing" Seminar | |
Yaraku (β) | "Pre-edit, post-edit" comprehensive seminar |
「丸わかり」という表現はAI自動翻訳エンジンにとってなじみがなかったのかもしれません。Googleは「丸わかり」部分をすっぽり落としています。ヤラク翻訳βは「わかる」部分のみを訳出しています。そんな中、Microsoftは「丸わかり」の意味をもれなく反映させて「Full Understanding」と訳出していました。
2. Googleが他エンジンと異なる表現をしている例
Googleのエンジンについては、他と目立って異なる訳文はあまり見かけませんでした。汎用的なエンジンだと言えそうです。しかし、そのような中でもいくつかは他と異なる表現があったので一つご紹介します。
原文 | 「すべて確認済みにする」ボタンで、全セグメントが確認済みになります。 |
Yaraku (β) | Click ‘Check all’ button to check all segments. |
All segments will be confirmed with the ‘Confirm all’ button. | |
Microsoft | The Mark All as Verified button confirms all segments. |
この原文に対しては、全エンジンが異なる訳出をしていました。
まず、「確認」という語彙に対する訳語が「comfirm」「check」「verify」など様々でした。そして、語彙よりも少し大きな文節の単位で見ると、「すべてを確認済みにする」という、原文では前半にあたる節を訳文で後半にもってきているのはGoogleのみでした。
ざっくりと意味をマッピングすると、以下のようなイメージです。対応する意味同士を同じ色で囲んでみました。Googleの訳出結果のみが、文節の順番が違うことが分かると思います。
操作マニュアルなど、読み手の行動を案内するテキストでは、その行動を示す部分(ここでいう「すべて確認済みにするボタンを押す」という部分)を文頭に持ってくることが多いため、ここではGoogleのみがこの文脈において慣習的でない訳出をしているということになります。
ただし、ここでは訳文の良し悪しの話ではなく、異なる表現を参照できることで表現の幅が広がる、という話にとどめておきたいと思います。
4. Yaraku Translate βが他エンジンと異なる表現をしている例
Yaraku Translate βは、今回試したニュースレターの翻訳においては、他エンジンと大きく異なる訳文を出してくることがあまりありませんでした。他の3エンジンに比べて大きく優れている部分や大きく劣る部分がない、汎用的なエンジンと言えそうです。語彙単位では、他のエンジンと異なる表現を出している部分がありました。
「機能追加」の「追加」という部分に対し他3エンジンは「additional」、「added」、「addition」などと訳している中、ヤラク翻訳βは「New features」と訳出しています。
以上各エンジンの文例を取り上げて見てみました。どの表現が適切なのかは媒体や状況によって変わるため、良し悪しについては触れませんが、エンジンが複数ある中で1つのエンジンが異なる表現を示してくれることもあるということが分かっていただけたかと思います。訳文を仕上げていく際にはぜひ色々なエンジンの出力を比較してみてください。
まとめ:複数のエンジンを同時併用することで訳文の質を上げる
同じ文書内であっても違うエンジンの訳を採用したい場合があります。例えばニュースレターの中でも、ちょっとこなれた意訳(※)にしておきたい箇所(タイトルなど)、一語一句情報を落とさずに訳出してほしい箇所など様々ですよね。
※意訳…元の文の一語一語にとらわれず、文章の目的や意味を汲み取った表現に翻訳すること。
『ヤラクゼン』では複数のエンジンの結果を同時に参照できます。興味を持ってくださった方はぜひ無料トライアルをお試しください。