2016年11月12日土曜日

Google翻訳にニューラル・ネットワークが実装されたって?

寒いっ! (←今日のマクラはこれだけ/笑)

・  ・  ・  ・  ・

昨日くらいから、あちこちでニュースになっていますね。

という訳で試してみました。以下のような感想を持ちました。
  • 語彙量と表現力が不十分なことが目立ちますが、概要は概ね正しく翻訳できることが多いようです。世界中のユーザが使うたびに「学習する」翻訳装置なので、いずれもどんどん改善されて行くでしょう。
  • 日本語のような非論理的な言語と、英語のような論理的な構造を持つ言語の間での自動翻訳でも、ある程度は主語・目的語が補われ/削除され(←従来の自動翻訳はココが非常に弱かった)、ソコソコ自然な文章が作成されるようです。
  • ただし、この補われ/削除される過程において、文章の一部が丸々消えてしまったり、誤った語が補われることにより、致命的な誤訳を起こす様子もしばしば見られました。
言語構造(論理性など)・人々の思考方法・人々の常識が違う世界同士で「完璧な翻訳」などあり得ませんので、そこは割り切って使うのが良いでしょう。この言語間(日本語と英語、など)の論理構造の違いを意識し、入力前の文章を整えてやれば、以前よりずっと高い精度の翻訳をしてくれるようになったと思います(これは、たとえば英作文時、和文原文をする際に用いると非常に有効な手法でもあります)

この辺りをキチンと分かった上で使えば、「かなり使える翻訳装置」になっていると思います。

たとえば日本語を英語に翻訳する際には、日本語で曖昧になりがちな
  • 時制、単数/複数、定冠詞・不定冠詞の違いを明確にする
  • 論理の流れが明確になるような文章構造にする
  • 句読点や括弧を有効に使う
あたりを工夫すると、けっこうマトモな翻訳になるようです。また、
  • 1文1文を短めに区切り、各文の関係を接続詞で明確にする
のも非常に有効です。たとえば、入力側をこんな風に整えてやると(日本語としてはカナリ不自然ですが、各単語と文章単位の掛かり合いを明確にしています)

①日本の有名な文学作品の英訳 (原文を整えています)

入力例①(和文)

まぁこれ位手を入れないと、正しそうな英語は出力してくれないということで。ここでも、たとえば「おじいさん」では「old man」なのか「grandfather」なのかわからなくなるので、「老人」。「おばあさん」は「老女」。時制も全て過去形にしています。句読点ひとつで英訳が結構変わっちゃうので、そこも工夫しています。…と苦労(でもないか)をすると、出力はソコソコ正しそうな英語になってくれます(まだ納得しきれる物ではなけど…もういいやっ!/笑)「どんぶらこ、どんぶらこ」の所だけ、どうしても英語に出来ませんでしたけどっ!(笑)

出力例①(英文)

上の翻訳へのリンク:
  • このGoogle翻訳(文章付き)に飛ぶリンクですが、「学習する翻訳装置」なので、皆様が御覧になる時は、当ブログとは出力(英訳)が少し異なっているかも知れません。
②論理構成のしっかりした日本語の英訳(原文ママ)

最初から論理構造のしっかりした日本語の場合、原文ママで概ね正しそうな翻訳をしてくれます。

入力例②(和文、数字をアラビア表記に変えた他は原文ママ)
出典:加藤周一「日本文学史序説〈上〉」(筑摩書房、1999/04), p. 25

出力例②(英文)

上の翻訳へのリンク:

んー、何か微妙に間違っている気もしますが(幾つか単語が消えている?)、このレベルなら修正はさほど難しくないでしょう。

口語表現については面白い?微笑ましい?です(感嘆詞に対する翻訳は結構ダメダメですねえ/笑)。コテコテの方言(日本語の多様性)への対応はイマイチですが、でもそこそこ翻訳してくれるようです(以前よりはるかにマシになったような)。以下、サンプルその③・④。面倒なので(笑)スクショ無し・Google翻訳へのリンクのみで行きます。

③関東エリアでありそうな口語表現の英訳

④関西エリアでありそうな口語表現の英訳
関西弁がおかしい点については勘弁して下さい。

なお、「クソッ!」とかの乱暴な言葉を入れると、公共の場に相応しくない英語表現が出てきます(ハリウッド映画などではありがちな表現なのですが、少なくともビジネスやあまり親しくない人との会話では避けるべき表現だと思います)。ご利用は気をつけてたいですね。

次は、英文和訳、Webページまるまるやってもらいましょうか。

⑤英語作品のWebページ和訳
言っていることはある程度わかりますが、意味不明な所も多いです。作品の味わいも全くありません(笑)。これは当然、日本語に翻訳するために書かれた(翻訳しやすい形に整えた)英文ではないからです。

では、もう一丁!

⑥英語作品のWebページ和訳・その2
フランス語原作の英語訳を入力に使ったからでしょうか、それとも作風の為でしょうか、何を言っているのかさっぱりわかりません(笑)。

まぁGoogle翻訳さんには、もっと勉強してもらい、より便利な翻訳装置になってもらいましょう。

・  ・  ・  ・  ・

後半ちょっと暴走しましたが、本題に戻ります。

今後の語学教育(特に最初の外国語=英語=で)は、言語間の論理構造の違いを学び、翻訳ソフトを使いこなす手法を学ぶ、という部分に重点がシフトして行くかも知れませんね。教育する側(学校・塾)がそのように意図せずとも、学習する側(生徒)がどんどん自動翻訳に依存するようになって行くのは間違いないでしょう。ただ、翻訳装置の出す訳文が正しいか否かを判断する読解力(いずれヒアリング力も)は必要ですから、語学力が不要になる日は当分先でしょう(書く/話すのは母国語が中心になって行くでしょうから、外国語のライティング力・スピーキング力の重要度は下がっていくかも知れませんが、文章の論理構成力は必要です)。翻訳装置の力を借りるのがどんどん当たり前になって行き、語学教育/学習の本質すら変わってしまう気がします。

翻訳業の方々はこれからは、従来よりも「腕の見せどころ」が増えるでしょうね。専門用語などは機械はすぐ学習してしまいますが、言語間の論理構造・文化の違いを超えて、解り易く伝えるというのは、機械が行なうのはもう少し先だと思います。ここに人間の活躍の場がありそうです。
  • ン十年前の海外の専門書の翻訳本って、業界の大御所(英語の専門家ではない)が翻訳する本も多く、読み難いものが多かったように思います。それがここ10年位の間でしょうか、優れた翻訳家が多く出てきました(彼ら/彼女らの翻訳作業を見ていると、特定の分野の専門家ではなく、翻訳の専門家と言えるでしょう;翻訳作業に入るにあたって、その業界の用語等を猛勉強してから翻訳作業をしているようです)。
・  ・  ・  ・  ・

さてこのGoogle翻訳。結構便利に使えそうですが、入出力した情報は全~部Googleさんにも蓄積されちゃいますから、間違っても機密文書の翻訳(下訳含む)に使ったりしてはいけませんね。交渉・契約の書類などが一番キチンと翻訳したい文書だったりします…、便利な道具ほど使い方(使い所)は難しいです。

・  ・  ・  ・  ・

柄にもなく結構真面目なコトを書いてしまいました。明日は趣味丸出しで行きますよ!(笑)

0 件のコメント:

コメントを投稿