機械翻訳、ニューラルネットワーク、LLM：ウェブサイトにとっての本当の違いとは

この記事の内容: 統計的手法からLLMアプローチまで、自動翻訳技術がどのように進化してきたか、そして多言語サイトのツールを選択する上でそれがなぜ重要なのか。

「機械翻訳」という言葉は、非常に多様な技術を指します。2010年のGoogle翻訳と、現代のLLMが行うことは、根本的に異なります。その違いを理解することは重要です。なぜなら、ウェブサイトの翻訳品質は、コンバージョンと検索順位に直接影響するからです。

統計的機械翻訳は、並列コーパスのテキストで機能しました。システムは翻訳されたドキュメントを分析し、各単語またはフレーズの統計的に最も可能性の高い翻訳を選択しました。

結果：翻訳は機械的で、コンテキストを失い、特徴的な「機械的な」表現を生み出しました。SMTについては、翻訳されたテキストを解読する必要があるという冗談が言われていました。

SMTは、2016年から2017年以降、商用システムでは事実上使用されていません。

ニューラル機械翻訳は、単語ごとではなく、テキスト全体をコンテキストを考慮した単一のまとまりとして処理します。

SMTと比較した主な改善点：

Google翻訳は2016年にNMTに移行しました。DeepLは当初からNMTエンジンとして構築され、長らく品質のリーダーシップを維持していました。

ほとんどのテキスト（技術的な説明、商品カード、標準コンテンツ）では、NMTは許容できる結果をもたらします。

大規模言語モデル（GPT-4、Claude、Gemini）は専門の翻訳機ではありませんが、そのトランスフォーマーアーキテクチャは、複雑なテキストに対して質的に異なる結果をもたらします。

LLMが優れている点：

マーケティングテキスト。 ドイツ語で「無料デモをお試しください」は、直訳ではなく、ネイティブスピーカーにとって行動を促すような表現です。LLMは単語を翻訳するだけでなく、タスクを理解します。
文化的適応。 呼びかけ、トーン、フォーマルさのレベルは、言語によって異なります。LLMはターゲット文化に合わせて適応させます。
SEOテキスト。 異なる言語でのキーワードは直訳ではありません。LLMは必要なクエリを自然に組み込むことができます。
ブランドのコンテキスト。 トーン・オブ・ボイス、専門用語、禁止されている表現を伝えることができ、LLMはそれらを考慮します。

LLMが過剰な場合： 技術仕様、標準的な説明、繰り返しコンテンツ — そこではNMTがより速く、より安価に十分な品質を提供します。

多くの自動ウェブサイト翻訳ツールはGoogle Translate APIまたはDeepLを使用しています — これらはNMTであり、基本的なコンテンツには十分です。ツールの説明に「AI翻訳」とだけ書かれていて詳細がない場合、通常は同じNMTです。

結果が重要な場合、つまりマーケティングテキスト、CTA、ユニークな説明において違いが現れます。まさにここでLLMアプローチが顕著な利点をもたらします。