ニューラル機械翻訳は、翻訳において次なるブレークスルーな技術として、多方面から期待を寄せられています。では、このテクノロジーがどのように機能するのか、またどこから来たのか、歴史や関連技術について詳しくみていきましょう。
ニューラル機械翻訳の歴史
Neural machine translation(NMT)は自動機械翻訳における最新技術の1つです。しかし、多くの技術的進歩と同様に、NMTはそれ以前の一連のアイデアと、その進歩の積み重ねにより、誕生した技術です。よって、自動機械翻訳の歴史を見てみる価値があります。
The Georgetown Experiment ジョージタウン大学・IBM社の共同実験
言語の機械翻訳というアイデアは、それが現実になるずいぶん前から存在していました。もっとも早く、そしてよく知られている研究の1つは、1950年代に行われたジョージタウン大学の実験(”The Georgetown Experiment”)です。
この実験は、1954年1月7日にジョージタウン大学と情報技術会社IBMが関わるプロジェクトとして行われました。このシステムは単純化されたものでしたが、ロシア語から英語へと60文以上の文を自動的に翻訳したことで世間を揺るがせました。これがきっかけで多方面からの機械翻訳研究への関心を集めました。
初期の機械翻訳の目標
今、私たちは日常的にインターネット検索エンジンなどにある機械翻訳について考え・触れる機会があります。もっと言えば、これは言葉の壁を越えて互いにコミュニケーションする方法として世間的に認知、そして今の注目されています。しかし、これは当初の機械翻訳開発の目的ではありませんでした。最初のコンピュータやインターネットと同じように、機械翻訳も元々は政府の技術であり、主に科学雑誌のような専門分野の文献を翻訳するという目的のためにロシアとアメリカ合衆国によって先行開発されました。
統計的機械翻訳(SMT)
今日最も一般的な機械翻訳は、統計的機械翻訳またはStatistical Machine Translation (SMT)と呼ばれる技術です。これは、ルールベースのアプローチに依存する機械翻訳です。つまり、特定の言語ルールが設定され、それらを使用してある言語を別の言語に翻訳します。この技術は有効性はありますが、もちろん欠点もあります。例えば、これらの規則は不正確で不格好な翻訳につながるということ、または一方の言語で同等の意味を持たない単語やフレーズなどの翻訳に苦慮します。
では、これらがどのようにニューラル機械翻訳(NMT)につながったのか
ニューラル機械翻訳(NMT)は、翻訳を迅速、正確、かつシームレスにしたいというニーズを実現した技術です。過去のような入力スタイルではなく、人間という生物の機能性を元にしたデザイン・設計されたAIベースのシステムです。予めプログラムされた規則だけに限定されるのではなく、人間と同じ様に「学ぶこと」ができるシステムです。この技術はまだ普及してはいませんが、それは今後の機械翻訳が向かうべき次のステップになり、さらなる注目を浴びる分野となることでしょう。
その他にも下記サイトを参考にご覧ください。
- IBM press release concerning the demonstration(英文:IBMによるGeorgetown Experimentについてのプレスリリース文)
- NPR.org: Machines, Lost In Translation: The Dream Of Universal Understanding (英文: Machine Lost in Translation: 完全なる相互理解の世界に向けて)*Georgetown Experiment当時の研究の様子、現在の専門家による機械翻訳の今後に対する考察・コメントなど