「機械翻訳」という言葉は、非常に多様な技術を指します。2010年のGoogle翻訳と、現代のLLMが行うことは、根本的に異なります。その違いを理解することは重要です。なぜなら、ウェブサイトの翻訳品質は、コンバージョンと検索順位に直接影響するからです。
第1世代:統計的機械翻訳(SMT)
統計的機械翻訳は、並列コーパスのテキストで機能しました。システムは翻訳されたドキュメントを分析し、各単語またはフレーズの統計的に最も可能性の高い翻訳を選択しました。
結果:翻訳は機械的で、コンテキストを失い、特徴的な「機械的な」表現を生み出しました。SMTについては、翻訳されたテキストを解読する必要があるという冗談が言われていました。
SMTは、2016年から2017年以降、商用システムでは事実上使用されていません。
第2世代:ニューラル機械翻訳(NMT)
ニューラル機械翻訳は、単語ごとではなく、テキスト全体をコンテキストを考慮した単一のまとまりとして処理します。
SMTと比較した主な改善点:
- 単語は孤立して翻訳されず、文全体のコンテキストが考慮されます
- イディオムや定型表現がより正確に処理されます
- テキストの自然さが大幅に向上
- トーンとスタイルがより良く保持される
Google翻訳は2016年にNMTに移行しました。DeepLは当初からNMTエンジンとして構築され、長らく品質のリーダーシップを維持していました。
ほとんどのテキスト(技術的な説明、商品カード、標準コンテンツ)では、NMTは許容できる結果をもたらします。
第3世代:LLM翻訳
大規模言語モデル(GPT-4、Claude、Gemini)は専門の翻訳機ではありませんが、そのトランスフォーマーアーキテクチャは、複雑なテキストに対して質的に異なる結果をもたらします。
LLMが優れている点:
- マーケティングテキスト。 ドイツ語で「無料デモをお試しください」は、直訳ではなく、ネイティブスピーカーにとって行動を促すような表現です。LLMは単語を翻訳するだけでなく、タスクを理解します。
- 文化的適応。 呼びかけ、トーン、フォーマルさのレベルは、言語によって異なります。LLMはターゲット文化に合わせて適応させます。
- SEOテキスト。 異なる言語でのキーワードは直訳ではありません。LLMは必要なクエリを自然に組み込むことができます。
- ブランドのコンテキスト。 トーン・オブ・ボイス、専門用語、禁止されている表現を伝えることができ、LLMはそれらを考慮します。
LLMが過剰な場合: 技術仕様、標準的な説明、繰り返しコンテンツ — そこではNMTがより速く、より安価に十分な品質を提供します。
ウェブサイトにとっての実用的な価値
- 商品カード、技術仕様: NMTで十分
- マーケティングテキスト、見出し、CTA: LLMまたはネイティブスピーカーによる必須の校正
- 法律文書、プライバシーポリシー: プロの翻訳のみ
- SEOコンテンツ: 検索クエリと構造を考慮したLLM
- ブログと記事: LLM + 編集による修正
ツール選択においてこれが重要な理由
多くの自動ウェブサイト翻訳ツールはGoogle Translate APIまたはDeepLを使用しています — これらはNMTであり、基本的なコンテンツには十分です。ツールの説明に「AI翻訳」とだけ書かれていて詳細がない場合、通常は同じNMTです。
結果が重要な場合、つまりマーケティングテキスト、CTA、ユニークな説明において違いが現れます。まさにここでLLMアプローチが顕著な利点をもたらします。
