現在人気の機械翻訳として Google翻訳とDeepL翻訳があります。

Google翻訳は、Google社が作った機械翻訳サービスです。当初の翻訳品質はそれほど高くなかったのですが、2016年11月にディープラーニングを活用したGoogle Neural Machine Translation (GNMT、Googleニューラル機械翻訳)というシステムに変わったことにより、特に中国語と日本語の品質が大幅に改善されたといわれています。

DeepL翻訳は、ドイツのDeepL社が開発した機械翻訳サービスです。当初は欧州言語のみ対応していましたが、2020年3月に日本語版も追加されました。DeepL社は以前から対訳検索エンジンのLingueeを運営しており、そこで集めた対訳データとディープラーニングを使って、高品質の機械翻訳サービスを提供しています。

いずれも最先端のAI技術を用いて、ユーザーが入力したテキストを別の言語に翻訳する機械翻訳サービスです。
どちらもディープラーニングを用いた類似サービスですが、いくつかの違いがあります。

言語データによる違い

両者の最も大きな違いは、各ツールが学習させる言語データです。

DeepL Translatorは、人力で翻訳された文章、熟語、テキストの断片からなるLingueeというオンライン辞書の膨大なコーパスを利用しています。

一方、Google翻訳では、さまざまな言語のデジタルリソースを組み合わせて使用しています。このツールのオリジナルのデータベースは、EU議会の議事録を翻訳した文書のコレクションと言われています。

Google翻訳とDeepL翻訳の歴史と対応言語

  • DeepL翻訳は2017年に開始されたサービスで、現在では31の言語をサポートしています。
  • Google翻訳は2006年に開始されたサービスで、現在では109の言語をサポートしています。

Google翻訳は多くの言語に対応している一方、DeepL翻訳は主にヨーロッパの言語に特化しています。

Google翻訳とDeepL翻訳の精度と自然さ

Google翻訳も年々改善されてきておりますが、いくつかの研究やユーザーの意見によると、特にヨーロッパの言語については、一般的にDeepLはGoogle 翻訳よりも正確(流暢)であることが示唆されています。(あくまでも一般論です。この点について弊社としてはまだまだ考察の余地があると考えています)

しかし、DeepL翻訳も完璧な翻訳をするわけではなく、時に誤った単語や表記を選択することがあり、また、苦手な構文をごっそり省略することもあります。

こういったエラーを確認するためにも英語力のある人間の最終チェックは欠かせません。
機械翻訳後に人間のチェックを入れる作業のことをポストエディットと言います。(ポストエディットの詳細はこちら

この 機械翻訳 と人間の翻訳との関係については今後もこのブログで取り上げていく予定です。

※人力翻訳・ポストエディットのご相談はこちらまで