Yarakuzen
Yarakuzen

2024 年 6月 19 日

【コラム】ChatGPTの翻訳で思ったこと、学んだこと。

ChatGPTでの翻訳で思ったこと、学んだこと。

ChatGPTやGeminiなどの生成AIに関するニュースが目立つ今日この頃。それらは翻訳にも活用できるため、翻訳業務への活用が検討されています。

翻訳といえば、つい最近までは機械翻訳(無料の自動翻訳サイトなど)を使うことが主流でした。しかし、ChatGPTなどの生成AIによる翻訳の自然さや流暢さは機械翻訳に引けを取らず、しかも翻訳文を希望の条件に沿って出せるため、生成AIでの翻訳の方が便利なのでは、と思うほどです。

ただ、なぜ生成AIがこれほどまでに自然で流暢な翻訳ができるかは謎です。謎に思った私は、そのことについて自分なりに調べて、考えてみました。

あくまでも私の理解と意見なので、「ChatGPTの翻訳はなぜ自然で流暢なのか」の答えではなく、「一社員が思ったこと、学んだこと」の読み物として楽しんでいただけば幸いです。

 

【目次】

 

まず始めに断っておきますが、ChatGPTなどの生成AIによる翻訳は、原文(翻訳前の文)とプロンプトが毎回同じでも、翻訳する度に異なる翻訳結果が出ることがあります。そのため自然さや流暢さといった要素をスコアリングすることは難しく、この記事ではあくまでも「一般的にそう言われている」「筆者がそう感じている」という考えのもとで書いています。

ただ、以下の表(MM総研「日米企業におけるChatGPT利用動向調査」)を見ると、日本国内の調査対象者(ChatGPT利用者)の30%以上は翻訳での活用をしており、米国にいたっては対象者の半分以上の人が利用している事実があります。

この数字が、ChatGPTの翻訳結果が自然で流暢な理由のエビデンスにはなりませんが、ChatGPTが既存の翻訳エンジンと同じように活用できることを表していると思います。

chatgpt

出典:ChatGPTの業務利用、米国ではすでに過半数が使用中。一方日本はわずか7%【MM総研調べ】

 

 

ChatGPTの翻訳はそもそも正確なのか

ChatGPTの翻訳が「自然かどうか」という話の前に、ChatGPTの翻訳が「正確か」ということを考えてみたいと思います。翻訳は単に自然な言い回しで流暢であれば良いのではなく、原文の意味を正確にくみ取って訳されているかが重要です。

例えば、
英:I'm going to run in the Boston Marathon.
という英文があったとして、これを以下のように訳すとします。

日:ボストンのマラソン大会で優勝を目指します。

これは日本語として自然で流暢ですが、原文の意味(直訳:私はボストンマラソンに出るつもりです。)からはずれてしまっています。そのため「ボストンのマラソン大会で優勝を目指します。」の訳は、流暢だが正確ではない訳、と言えます。

 

しかしChatGPTはそのような「流暢だが正確ではない訳」を出すのではなく、「流暢で正確な訳」が可能です。以下はその一例です。

英:I'm going to run in the Boston Marathon.

日:私はボストンマラソンに出場します。

この訳だと「出場」という言葉を流暢に使っていますし、原文の意味も正確にくみ取っています。ChatGPTは翻訳エンジンではないにもかかわらず、流暢で正確に訳せる点が、好まれるところではないでないでしょうか。

 

正確なのは機械翻訳も同じ

原文の意味をくみ取り、翻訳文(翻訳したあとの文)に反映させる「正確さ」は、ChatGPTだけが優れているわけではありません。実は機械翻訳(無料の自動翻訳ツールなど)でも正確な訳を出すことは、既に実現できています。

例えば先ほどの"I'm going to run in the Boston Marathon."の訳文にしても、無料の翻訳サイトで翻訳してみると「ボストンマラソンに出場するつもりです。」と出てきました。原文の意味と相違なく、伝えたいことが翻訳文に反映されているので正確性は問題ありません。

このように正確さは機械翻訳でも実現できています。むしろChatGPTよりも機械翻訳の方が、翻訳品質の改善のために対訳データをたくさん学習しており、正確性は優れているのかもしれません。

しかし、正確な翻訳ができる機械翻訳がある中で、ChatGPTの翻訳に魅かれ、これを活用する流れがあるのは、やはり機械翻訳の「自然さ」「流暢さ」に課題を感じているからではないでしょうか。そしてChatGPT(あるいはこれ以外の生成AI)が、その課題を解決してきているからなのではないでしょうか。

 

私たちが思う自然で流暢な訳

もう一つ別の例を見てみましょう。以下の文章は自然で流暢でしょうか。

英:I love you.

日:私はあなたを愛しています。

こちらもまず「正確さ」を考えてみると、その点は問題ありません。前後に文章はなく文脈もないのでこの訳は正確です。

一方で「自然で流暢か」と聞かれたら、どう思いますか。やや堅苦しい文章ではないでしょうか。日常生活で「私はあなたのことを愛しています。」というフレーズを使うかと言われたら、使わない人がほとんどだと思います。

「love」=「愛する」という訳に違和感はないでしょう。しかし日常的に「愛する」という言葉を使うかというと、そうではないと思います。「愛している」というと、使う場面が限られていたり、テレビドラマのここぞというシーンで使われるセリフのような印象があります。

"I love you."を「私はあなたを愛しています。」と訳すのは正確ですが、私たちが普段使わない言葉という意味で「自然で流暢ではない」と感じます。

 

では、以下の訳ではどうでしょうか。

英:I love you.

日:大好きだよ。

「love」は「狂うほどに好き」というニュアンスなので、「愛している」という訳でなく「大好き」という訳でも正確です。そしてこの「大好き」という言葉を、「愛している」という言葉よりもよく使うかというと、使うのではないでしょうか。そして、「愛している」という表現よりも自然かと言われれば、自然だと思います。

そのように「自然」だと思うのは、結局のところ日常生活で耳にしたり口にしたりの頻度が高いかどうかによります。

「愛している」:よく見たり聞いたりするが、発する頻度は少ない言葉。

「大好き」:よく見たり聞いたり、発する言葉。そもそも「好き」という言葉自体に高頻度で出会うので、馴染みがあり自然さが増す。

 

翻訳の自然さ・流暢さは、私たちの日常や経験の中で、出現頻度が頻度が高い言葉かどうか、という基準により判断されるのではないでしょうか。さらに、より見て・聞き・発する言葉ほど、自然と感じます。

もちろん翻訳文が、常に私たちの日常で出現頻度の高い言葉で構成されれていれば良いのではありません。Time、Place、Occasionに合っていることも重要です。ただし、Time、Place、Occasionに沿った翻訳文でも、その条件内でよく見る言葉が使われているほど「自然で流暢な訳だ」と感じるでしょう。

 

進化した翻訳

ChatGPTで行う翻訳では、自然さを感じる他にもクリエイティブな翻訳結果を出し、ここがまた「すごい!」と思います。

例えば、「私たちは同じ釜の飯を食べた仲です。」を、ある自動翻訳で英語に訳すと以下のようになります。

英:We are friends who have shared the same food.

翻訳文として間違いではありませんが、直訳であり、原文の「同じ釜の飯を食べた仲 → 生活を共にした親しい仲 / 苦楽を分かち合った親しい仲」という意味が翻訳文に含まれていません。つまりこの英訳には「同じ釜の飯を食べた仲」という言葉の背景にある「生活を共にした親しい仲 / 苦楽を分かち合った親しい仲」という日本語のニュアンスがありません。

では、ChatGPTでは「同じ釜の飯を食べた仲」という原文から、そこに含まれるニュアンスを持ったままの英訳を出せるのでしょうか。

 

試してみたら、以下の翻訳結果が出てきました。

 

英:We've been through thick and thin together.(直訳:私たちは良い時も悪い時も一緒に乗り越えてきました。)

いかがでしょうか。訳として悪くないと思いますし、「同じ釜の飯を食べた仲」の直訳ではない英訳ができました。従来の機械翻訳では、このような意訳が苦手でした。それゆえ、正確性を押さえた意訳を作るのはハードルが高かったのです。

しかし、ChatGPTでは原文の意味・ニュアンスを残しつつ翻訳する作業もできます。ここが機械翻訳とChatGPTのような生成AIの違いであり、面白いところです。そのような翻訳は産業翻訳よりも文芸翻訳でよく行われ、機械翻訳ではそこまで担うことはほぼありませんでした。

しかし生成AIがそのような意訳もできるとなると、生成AIによる翻訳の可能性が一気に広がります。これまで機械翻訳では踏み入れられなかった領域に、生成AIなら入っていけるのではないかという期待が持てます。

 

自然・流暢でクリエイティブな訳ができる理由

ではなぜChatGPTが、自然で流暢で、機械翻訳ではできないクリエイティブな翻訳ができるのでしょうか。

小難しい話になりますが、従来の機械翻訳は対訳データ(例えば英語と日本語の対応するフレーズ)を中心に学習しています。「A」という文章が入力されたら「B」という翻訳結果を返す、という形です。

A:I love you.

B:私はあなたを愛しています。

もちろん本来はこのような単文だけでなく、前後の文脈を加味して訳されるので「私はあなたを愛しています。」以外の翻訳文が出ることもあります。しかし基本的には「私はあなたを愛しています。」の意味の枠を超えない訳が出る仕組みです。

一方で、ChatGPTはインターネット上にある様々な文章を学習しています。もちろん、それらの文章は人の手によって書かれているので、自然で流暢な文章だと思われます。おそらく、個人のブログなどの含まれるので、不自然な文法・表現のデータも取り込まれることもあると思いますが、多くは人の手で書かれた自然な文章です。

ここで気を付けたいのは、ChatGPTが学習しているのはあくまでも「文章」であり、「対訳データ」ではないということです。つまり、「I love you.」という英語に対しては、日本語では「私はあなたを愛しています。」と返す、というような学習はしていません。

 

では、ChatGPTはどのような学習をしており、それをどのように翻訳に活かしているのでしょうか。

ChatGPTが学習するデータには、ニュース記事、小説、ブログなど、様々なジャンルの文章が含まれています。それらのデータを通して、ChatGPTは言葉の構造や文法、文脈、表現などを理解します。

例えば「I love you.」というフレーズを、ChatGPTは文脈やシチュエーションも加味して意味を理解します。そのため、このフレーズが恋愛小説の中で使われるケースと、友人間の会話で使われるケースでは、意味合いが違うことも理解していると考えられます。

文脈やシチュエーションを加味してそのフレーズの意味を学んでいるので、ある意味人間のような理解の仕方です。このような方法で学習しているので、「I love you.」という言葉に対して、カジュアルな文脈では「大好きだよ。」と訳したり、セリフの中では「愛しています。」と訳したりできるのです。

 

『英語で「I love you.」が使われる文脈が「X」でシチュエーションが「Y」。同じように「X」の文脈、「Y」のシチュエーションで使われる相手に自分の好意の気持ちを伝える日本語の表現は?』
というふうに考えて、「大好きだよ。」や「愛しています。」のような訳を出していると考えられます。

 

実際にはこのような数パターンではなく、何百万・何千万という量を学習しており、私たちが考えられないほどの要素を考慮してその場に応じた訳を瞬時に出しているのでしょう。しかも感覚的に「この訳が良いな」と選んでいるのではなく、データに基づいて適切な翻訳文を出しているため、高い確率で私たちは自然さ・流暢さを感じるのだと思います。

 

そのような翻訳結果の出し方は、生成AIだから可能なのです。そのような仕組みだからこそ、自然さ・流暢さに加え、機械翻訳とは一線を画した「クリエイティブな翻訳」ができるのです。

そして、自然で流暢でクリエイティブな翻訳を可能にしたのは、他の誰でもなく「私たち」です。私たちの文章をもとに学習しているのですから。

 

 

生成AIによる人の成長

機械翻訳は、マニュアルや論文、ビジネス文書などの分野で活用されてきました。一方で小説や詩などのクリエイティビティが重視される翻訳では限界がありました。しかし、生成AIの学習が対訳データではない特性で、その限界を超えて翻訳の新たな可能性を作ってくれていると思います。

実はこのコラムも、ChatGPTに書いてもらった箇所があります。いかがでしょうか。大きな違和感はなく、自然ではないでしょうか。どのように書こうか悩み、筆が止まった箇所は多々ありましたが、ChatGPTの力を借りてインスピレーションを受けてここまで書き進められました。

 

この記事を書く中で、文章作成をChatGPTに完全に頼るのではなく、ChatGPTが作った文章からインスピレーションを受けて、さらに私がクリエイティブな文をつくれるというシナジー効果があると感じています。もしかしたら翻訳も同じように、ChatGPTのクリエイティブな翻訳結果からインスピレーションを受けて、よりクリエイティブな翻訳を作れるようになるのではないでしょうか。

ひとえに「自然で流暢な翻訳結果を出してくれるもの」と認識してしていたChatGPTは、私たちのクリエイティビティを刺激し、それを伸ばしてくれるツールなのではないでしょうか。仕組みがわからず、なんとなく不気味な生成AIも、使い方ひとつで私たちの能力を大いに伸ばす良きパートナーなのかもしれません。

 

謝辞:本文の一部は、八楽株式会社チーフエバンジェリストの山田優氏のアドバイスを受けて執筆しました。(山田先生、ご丁寧にアドバイスいただきありがとうござました!)

 

Keisuke Watanabe

この記事の執筆者:

八楽株式会社のマーケティングチーム所属。Google翻訳など複数の翻訳エンジンを毎日使用して、日本語の記事を英訳しながら英語勉強中。「自動翻訳で正しい翻訳文を出すためには正しい使い方が重要」と考え、それを多くの方に伝えるために情報発信に励んでいる。