2016年にGoogle、Microsoft、Systran、NICTからニューラルネットワークを搭載した機械翻訳エンジンが発表されてからニューラル機械翻訳の精度は飛躍的に向上し、機械翻訳・自動翻訳のスタンダードになりつつあります。
「Google翻訳などの、ニューラル機械翻訳の精度は信頼できるのか?」
「Google翻訳など無料の翻訳ツールのセキュリティが心配。情報漏洩のリスクはないのか?」といった声をよく伺います。
本記事では自動翻訳の精度について実例とともにご紹介し、導入時の検討事項であるセキュリティ上の問題点についてもお伝えします。
ニューラル機械翻訳とは?
機械翻訳の当初は、あらかじめ登録したルールと辞書情報を照らし合わせながら逐語訳を行う「ルールベース翻訳(Rule Based Machine Translation、RBMT、または RMT)」が主流でした。
その後、異なる言語の文と文が対訳の形でまとめられた対訳コーパスから統計モデルを学習し、未知の原言語文を翻訳する「統計翻訳 (SMT: Statistical Machine Translation)」へ。
そして第3世代の「ニューラル機械翻訳 (NMT: Neural Machine Translation)」の登場で、さらなる精度の向上が図られています。スマートフォンやPC利用者には身近なGoogle翻訳ですが、これはまさに、NMTのニューラルネットワークを利用した機械翻訳です。
これまでは、欧米の言語と日本語など、文法や単語の類似が少ない言語を翻訳する際には、逐語訳したものをつなげ直す従来の翻訳技術だけで精度を上げることは困難でした。そこで、翻訳機械に学習機能をつけるという技術革新、つまりニューラル機械翻訳(NMT)が開発され、近年の飛躍的な進歩が成し遂げられたのです。膨大な対訳データをコンピュータ自身が人間からの指示を待たずに自ら「学習」することで翻訳精度を上げるニューラル機械翻訳は、データ処理能力と速度が格段に進歩した現代だからこそ可能になった技術です。
ディープラーニングの手法を取り入れたAIは、以前から特定の分野でめざましい成果を上げてきました。たとえば、囲碁の世界トップ棋士に勝利した囲碁AI「AlphaGo(アルファ碁)」も、ディープラーニングによって人間を超えたAIです。そのAI技術がついに自動翻訳でも大きな成長を上げ、自動翻訳を仕事で使えるレベルにまで押し上げたのです。
ニューラル機械翻訳の精度は?
ニューラル機械翻訳(NMT)を使ったAI翻訳の特徴は、正確性と流暢性です。特に流暢さは格段に増し、人間に近い文章を書けるようになりました。
では実際に、自動翻訳の訳文を見てみましょう。
「Stay hungry, Stay foolish」のフレーズで有名なスティーブ・ジョブス氏のスピーチの翻訳の一節を用いて、ニューラル機械翻訳と従来型の翻訳(ルールベース機械翻訳)とを比較してみます。
英語の原文
Your time is limited, so don’t waste it living someone else’s life. Don’t be trapped by dogma, which is living with the results of other people’s thinking. Don’t let the noise of others’ opinions drown out your own inner voice. And most important, have the courage to follow your heart and intuition.
翻訳文の例(2011年10月9 付日本経済新聞より引用)
あなた方の時間は限られています。だから、本意でない人生を生きて時間を無駄にしないでください。ドグマにとらわれてはいけない。それは他人の考えに従って生きることと同じです。他人の考えに溺れるあまり、あなた方の内なる声がかき消されないように。そして何より大事なのは、自分の心と直感に従う勇気を持つことです。
Google翻訳(ニューラル機械翻訳)の翻訳結果
あなたの時間は限られているので、誰かの人生を生きてそれを無駄にしないでください。他の人の思考の結果とともに生きている教義にとらわれないでください。他人の意見のノイズがあなた自身の内なる声をかき消してはいけません。そして最も重要なことは、あなたの心と直感に従う勇気を持っていることです。
従来型翻訳エンジン(ルールベース機械翻訳)の翻訳結果
あなたの時間は制限される。したがって、それ生きている他の誰かのライフを荒廃させてはならない。他の人々の考察の結果によって残る教養によって捕えられてはならない。他の意見のノイズをあなた自身の内側の声の外で溺れさせてはならない。そして最も重要である、あなたの心臓と直感に続いている勇気を持ちなさい。
いかがでしょうか。ニューラル機械翻訳であるGoogle翻訳の訳文精度の高さに驚かれた方も多いかと思います。
現在の自動翻訳は従来型と異なり、このように十分に意味が通じる訳文を出してくれます。少し手直しが必要な部分はあるものの、論理的な間違いはなく、何より日本語が自然です。
たとえば、「own inner voice」を「あなた自身の内なる声」と意訳的に訳している点。また、「heart」の訳語を「心臓」とせず、「心」をあてている点などは、従来の機械翻訳とは違い、人間が訳したような自然さが出ています。
機械翻訳は現在も学習を続け、精度を高めています。そして精度を高めたAI自動翻訳は、今やビジネスの場面においても有用なツールとなったのです。
Google翻訳などのセキュリティ
では、情報漏洩の可能性、安全性はどうなのでしょう。
自動翻訳を導入するにあたってはセキュリティ面を考慮することが重要です。有償のエンジンを利用する場合には、翻訳文書を他の目的に転用しないよう秘密保持約定書(NDA)に同意するなど、秘密保持に関する取り決めがあるのが一般的です。しかし無料で提供されている自動翻訳サービスにおいて、無料サービスでは多くの場合で秘密保持が保証されていません。
Google翻訳について、規約に以下の記述があります。
ユーザーがブラウザ上でアップロードしたデータについては、それらの使用・ホスト・複製・変更などを行うことのできるライセンスがGoogleに自動的に付与され、サービスの運営、プロモーション、改善、および、新しいサービスの開発のために利用されます。
(Google利用規約より引用)
Google翻訳では、入力した原文と訳文は流用されると書かれています。機密情報が含まれるビジネス文書を翻訳するときにこういった無料の翻訳ツールを使用することは大きな問題があることが分かります。
まとめ:ニューラル機械翻訳をビジネスで使いこなす
ニューラル機械翻訳の実用的な利用範囲は今後もますます広がっていくと思われます。
文章を自動翻訳で翻訳するだけではありません。オンラインイベントにおいて音声翻訳機能を使ったコミュニケーションを行ったり、ライブストリーミングを自動翻訳によってその場で理解したり、といったことも既に実現しています。
また、年々増加している日本で働く外国人労働者とのコミュニケーションにおいても、言語の壁を取り払うことができます。日本国内から海外向けに商品を販売する越境ECでは、世界中の顧客からの問い合わせに対する迅速な対応が可能です。
今後ますますニーズの高まる自動翻訳。使いこなせるかどうかがビジネスにおける勝負の分かれ目となりそうです。
セキュアな環境で翻訳ツールをビジネスで活用!
オンライン翻訳プラットフォームヤラクゼンには、Google翻訳の他にマイクロソフトの翻訳エンジンが搭載されており、文章の種類に応じて翻訳エンジンを使い分けることができます。また翻訳エンジン各社と個別契約を行っており、データ共有・転用は一切行われないので安心してご利用いただけます。
まずは無料トライアルをお試しください。