Zum Hauptinhalt springen

Übersetzungsmethoden

Champollion unterstützt zehn Übersetzungsmethoden. Jedes Sprachpaar kann eine andere Methode verwenden – Sie sind nicht an einen einzigen Ansatz für Ihr gesamtes Projekt gebunden.

Methodenvergleich

LLM-Anbieter

Qualitätsorientiert, Markdown-fähig, Coaching-kompatibel. Am besten geeignet für inhaltsreiche Projekte.

MethodeSchlüsselFunktion
llm (Standard)OPENROUTER_API_KEYLLM über OpenRouter – über 200 Modelle, automatisches Routing
llm-coachedOPENROUTER_API_KEYLLM + Grammatikregeln, Wörterbücher, Stilhinweise
openaiOPENAI_API_KEYDirekte OpenAI-API (gpt-4o, gpt-4o-mini)
anthropicANTHROPIC_API_KEYDirekte Anthropic-API (Claude Sonnet, Haiku, Opus)
geminiGEMINI_API_KEYDirekte Google-Gemini-API (Flash, Pro) – kostenlose Stufe

Traditionelle MÜ

Geschwindigkeits- und kostenorientiert. Am besten geeignet für hochvolumige Schlüssel-Wert-Paare.

MethodeSchlüsselFunktion
google-translateGOOGLE_TRANSLATE_API_KEYGoogle Cloud Translation API v2 (über 130 Sprachen)
deeplDEEPL_API_KEYDeepL-API mit Glossarunterstützung (über 30 Sprachen)
microsoft-translatorMICROSOFT_TRANSLATOR_API_KEYAzure Cognitive Services Translator (über 100 Sprachen)
libretranslate(selbst gehostet)Selbst gehostetes LibreTranslate (AGPL, kostenlos)

Infrastruktur

MethodeSchlüsselFunktion
api(pro Anbieter)Schlanker HTTP-Client für jeden REST-Übersetzungsendpunkt

Entscheidungsbaum


llm — LLM-Übersetzung (Standard)

Übersetzt über jedes beliebige LLM auf OpenRouter. Dies ist die Standardmethode und die vielseitigste.

Funktionsweise:

  1. Bündelt Schlüssel (standardmäßig 80/Batch) mit Register- und Kontextanweisungen
  2. Sendet an OpenRouter als strukturierten Prompt
  3. Parst die JSON-Antwort
  4. Validiert jede Übersetzung über das Quality Gate
  5. Schreibt bestandene Übersetzungen, wiederholt fehlgeschlagene oder weist sie ab

Verwendung: Die meisten Projekte. Insbesondere inhaltsreiche Websites mit Markdown, bei denen Codeblöcke und Shortcodes geschützt werden müssen.

Konfiguration:

{
"defaultMethod": "llm",
"model": "google/gemini-3.5-flash"
}

llm-coached — Gecoachte LLM-Übersetzung

Identisch mit llm, jedoch mit Grammatikregeln, Begriffswörterbüchern und Stilhinweisen, die in jeden Prompt eingefügt werden.

Funktionsweise:

  1. Lädt Coaching-Daten aus .champollion/coaching/<locale>.json oder dem coaching/-Verzeichnis eines Plugins
  2. Fügt Grammatikregeln, Wörterbuchbegriffe und Stilhinweise in den System-Prompt ein
  3. Wörterbuchbegriffe, die mit Quellschlüsseln übereinstimmen, werden als erforderliche Terminologie aufgenommen
  4. Die Übersetzung läuft wie bei llm ab, wobei die Coaching-Daten die Präzision erhöhen

Verwendung: Ressourcenarme Sprachen, fachspezifische Terminologie (juristisch, medizinisch), formelle Register oder jeder Fall, in dem die generische LLM-Ausgabe nicht präzise genug ist.

Format der Coaching-Daten:

.champollion/coaching/fr.json
{
"grammar_rules": [
"French adjectives agree in gender and number with the noun they modify",
"Use 'vous' for formal contexts, 'tu' for informal"
],
"dictionary": {
"dashboard": "tableau de bord",
"deployment": "déploiement",
"settings": "paramètres"
},
"style_notes": "Prefer active voice. Avoid anglicisms where a native French term exists."
}

Siehe auch: Leitfaden für ressourcenarme Sprachen


openai — Direkte OpenAI-API

Übersetzt direkt über die OpenAI Chat Completions API. Kein OpenRouter-Vermittler – Ihr Schlüssel, Ihr Konto, Ihr Nutzungs-Dashboard.

Modelle: gpt-4o (Standard), gpt-4o-mini

Funktionen:

  • ✅ Markdown-fähig (Inhaltsübersetzung)
  • ✅ Coaching-Unterstützung (Grammatikregeln, Wörterbuch-Überschreibungen, Stilhinweise)
  • ✅ JSON-Modus für strukturierte Schlüssel-Wert-Ausgabe
  • ✅ Exponentielles Backoff mit Wiederholung

Konfiguration:

{
"pairs": {
"en:fr": { "method": "openai", "model": "gpt-4o-mini" }
}
}
export OPENAI_API_KEY=sk-proj-...

Holen Sie sich Ihren Schlüssel unter platform.openai.com/api-keys.

anthropic — Direkte Anthropic-API

Übersetzt direkt über die Anthropic Messages API. Verwendet den Parameter system für Coaching-Daten und ermöglicht so das Prompt-Caching von Anthropic.

Modelle: claude-sonnet-4-6 (Standard), claude-haiku-4-5, claude-opus-4-7

Funktionen:

  • ✅ Markdown-fähig (Inhaltsübersetzung)
  • ✅ Coaching-Unterstützung (Grammatikregeln, Wörterbuch-Überschreibungen, Stilhinweise)
  • ✅ System-Prompt-Caching (verteilt die Coaching-Kosten über Batches hinweg)
  • ✅ Exponentielles Backoff mit Wiederholung

Konfiguration:

{
"pairs": {
"en:ja": { "method": "anthropic", "model": "claude-haiku-4-5" }
}
}
export ANTHROPIC_API_KEY=sk-ant-...

Holen Sie sich Ihren Schlüssel unter console.anthropic.com.

gemini — Direkte Google-Gemini-API

Übersetzt direkt über die Google-Gemini-generateContent-API. Kostenlose Stufe verfügbar – der beste kostenfreie Einstiegspunkt.

Modelle: gemini-2.5-flash (Standard), gemini-2.5-pro

Funktionen:

  • ✅ Markdown-fähig (Inhaltsübersetzung)
  • ✅ Coaching-Unterstützung (Grammatikregeln, Wörterbuch-Überschreibungen, Stilhinweise)
  • ✅ JSON-Antwortmodus über responseMimeType
  • ✅ Kostenlose Stufe (großzügiges tägliches Kontingent)
  • ✅ Exponentielles Backoff mit Wiederholung

Konfiguration:

{
"pairs": {
"en:ko": { "method": "gemini", "model": "gemini-2.5-pro" }
}
}
export GEMINI_API_KEY=AI...

Holen Sie sich Ihren Schlüssel unter aistudio.google.com/apikey.

Modellvalidierung

Die direkten LLM-Anbieter (openai, anthropic, gemini) validieren Ihren Modellstring bei der ersten Verwendung. Dadurch werden drei Kategorien von Fehlern erkannt:

Falsches Methodenformat – Verwendung eines Modellpfads im OpenRouter-Stil mit einem direkten Anbieter:

[WARN] OpenAI: model "google/gemini-3.5-flash" looks like an OpenRouter path.
Direct providers use bare model names (e.g., "gpt-4o").
To use OpenRouter models, set method to 'llm' instead.

Falscher Anbieter – Verwendung eines Modells eines völlig anderen Anbieters:

[WARN] Gemini: model "claude-sonnet-4-6" is an Anthropic model.
This provider (gemini) cannot serve Anthropic models.
Use --method anthropic or set "method": "anthropic" in config.

Veraltetes oder falsch geschriebenes Modell – Beim ersten API-Aufruf ruft champollion die aktuelle Modellliste des Anbieters ab und prüft Ihr Modell dagegen:

[WARN] Gemini: model "gemini-1.5-flash" not found in available models.
Similar models: gemini-2.0-flash, gemini-2.5-flash, gemini-2.5-pro
The API call will proceed — the provider will give the final verdict.

:::note Dies sind Warnungen, keine Fehler Die Modellvalidierung protokolliert Warnungen, blockiert jedoch nicht den API-Aufruf. Die Anbieter-API trifft die endgültige Entscheidung – ein zukünftiger Modellname könnte zu einem anderen Muster passen, und wir möchten nicht auf Basis von Heuristiken blockieren. :::


google-translate — Google Cloud Translation API

Direkte Integration mit der Google Cloud Translation API v2. Verwendet die REST-API – kein SDK, kein Dienstkonto. Nur der API-Schlüssel.

Verwendung: Hochvolumige Schlüssel-Wert-String-Paare, bei denen Geschwindigkeit und Kosten wichtiger sind als Feinheiten. Unterstützt über 130 Sprachen von Haus aus.

Einschränkungen:

  • ⚠️ Keine Markdown-Fähigkeit. Beschädigt Codeblöcke, Shortcodes und Interpolationsvariablen.
  • Keine Register-/Tonsteuerung
  • Kein Coaching und keine Terminologiedurchsetzung
npx champollion sync --method google-translate

:::tip Automatische Erkennung Wenn nur GOOGLE_TRANSLATE_API_KEY gesetzt ist (kein OpenRouter-Schlüssel), wechselt champollion automatisch zu Google Translate. Keine Konfigurationsänderung erforderlich. :::

deepl — DeepL-API

Direkte Integration mit der DeepL-Übersetzungs-API. Unterstützt Glossare für konsistente Terminologie.

Verwendung: Europäische Sprachen, in denen DeepL hervorragend ist (Deutsch, Französisch, Spanisch, Niederländisch, Polnisch usw.). Die Glossarunterstützung erzwingt eine konsistente Terminologie ohne Coaching-Daten.

Funktionen:

  • ✅ Automatische Erkennung des Free-/Pro-Endpunkts (Suffix :fx bei kostenlosen Schlüsseln)
  • ✅ Erstellung und Verwaltung von Glossaren
  • ✅ Steuerung der Formalitätsstufe
  • ⚠️ Keine Markdown-Fähigkeit – nur Schlüssel-Wert-Paare

Konfiguration:

{
"pairs": {
"en:de": { "method": "deepl" }
}
}
export DEEPL_API_KEY=your-key-here

Holen Sie sich Ihren Schlüssel unter deepl.com/pro-api.

microsoft-translator — Azure Cognitive Services

Direkte Integration mit der Microsoft Translator Text API v3.

Verwendung: Unternehmensumgebungen mit bestehender Azure-Infrastruktur. Unterstützt über 100 Sprachen, darunter viele, die Google Translate nicht abdeckt.

Funktionen:

  • ✅ Bis zu 100 Segmente pro Anfrage (hoher Durchsatz)
  • ✅ Optionaler Regionsparameter zur Latenzoptimierung
  • ⚠️ Keine Markdown-Fähigkeit – nur Schlüssel-Wert-Paare
  • ⚠️ Keine Inhaltsübersetzung – nur Schlüssel-Wert-Paare

Konfiguration:

{
"pairs": {
"en:ar": { "method": "microsoft-translator" }
}
}
export MICROSOFT_TRANSLATOR_API_KEY=your-key
export MICROSOFT_TRANSLATOR_REGION=global # optional

Holen Sie sich Ihren Schlüssel aus dem Azure Portal → Cognitive Services → Translator.

libretranslate — Selbst gehostete Übersetzung

Selbst gehostete Open-Source-Übersetzung mit LibreTranslate. Läuft lokal oder auf Ihrer eigenen Infrastruktur – keine API-Kosten, vollständige Datensouveränität.

Verwendung: Projekte, die Offline-Übersetzung, Einhaltung des Datenschutzes (DSGVO) oder kostenfreien Betrieb erfordern. Besonders nützlich für CI-Pipelines, die nicht von externen APIs abhängen sollten.

Funktionen:

  • ✅ Selbst gehostet – keine externen API-Aufrufe
  • ✅ Kostenlos und Open Source (AGPL-3.0)
  • ✅ Docker-Bereitstellung verfügbar
  • ⚠️ Keine Markdown-Fähigkeit – nur Schlüssel-Wert-Paare
  • ⚠️ Keine Inhaltsübersetzung – nur Schlüssel-Wert-Paare
  • ⚠️ Die Qualität variiert je nach Sprachpaar

Einrichtung:

# Run LibreTranslate locally with Docker
docker run -d -p 5000:5000 libretranslate/libretranslate

# Configure (optional — defaults to localhost:5000)
export LIBRETRANSLATE_API_URL=http://localhost:5000/translate
{
"pairs": {
"en:es": { "method": "libretranslate" }
}
}

api — Remote-Übersetzungs-API

Ein schlanker HTTP-Client für von der Community gehostete oder IP-geschützte Übersetzungsendpunkte. Champollion sendet Schlüssel aus und empfängt Übersetzungen zurück – es enthält keinerlei Übersetzungslogik.

Verwendung: Wenn Übersetzungsmethoden serverseitig gehostet werden (z. B. proprietäre Coaching-Daten, feinabgestimmte Modelle, FST-Pipelines, die nicht verteilt werden können).

{
"pairs": {
"en:crk": {
"method": "api",
"endpoint": "https://api.example.com/v1/translate",
"apiKey": "your-key"
}
}
}

:::note OCAP-kompatible Community-Übersetzung Die Methode api ist die Brücke zur OCAP-kompatiblen, von der Community gehosteten Übersetzung. Indigene und Minderheitensprachgemeinschaften können ihre eigenen Übersetzungsendpunkte hosten – wodurch Coaching-Daten, feinabgestimmte Modelle und sprachliches geistiges Eigentum unter der Kontrolle der Gemeinschaft bleiben – während Champollion sich als schlanker Client mit ihnen verbindet.

Siehe Eine ressourcenarme Sprache unterstützen für die vollständige Anleitung zum Community-Hosting und Eine Methode über eine API bereitstellen für die Endpunktanforderungen. :::


Konfiguration pro Sprachpaar

Die eigentliche Stärke liegt im Mischen von Methoden pro Sprachpaar:

champollion.config.json
{
"version": 3,
"pairs": {
"en:fr": { "method": "deepl" },
"en:ja": { "method": "openai", "model": "gpt-4o" },
"en:ko": { "method": "gemini" },
"en:ar": { "method": "microsoft-translator" },
"en:crk": { "methodPlugin": "crk-coached-v1" }
}
}

Dies übersetzt Französisch über DeepL (Glossarunterstützung), Japanisch über OpenAI (Qualität), Koreanisch über Gemini (kostenlose Stufe), Arabisch über Microsoft Translator (Abdeckung) und Plains Cree über ein gecoachtes Plugin (spezialisiert).

Plugins

Plugins sind vorgefertigte Übersetzungsrezepte für bestimmte Sprachpaare. Es handelt sich um JSON-Manifeste – kein Code –, die champollion mitteilen, welche Methode mit welchen Einstellungen zu verwenden ist und welche Qualität im Benchmark ermittelt wurde.

:::tip Vom Eval-Harness zur Produktion mit einem einzigen Befehl Plugins, die im Eval-Harness entwickelt und erprobt wurden, können direkt installiert werden – die Methode, die Sie dort validieren, wird hier mit einem einzigen plugin install-Befehl bereitgestellt. Siehe MT-Evaluierung für den vollständigen Evaluierungs-Workflow. :::

champollion plugin install ./french-formal-v1/
champollion plugin list
champollion plugin remove french-formal-v1

Siehe die Plugin-Spezifikation für das vollständige Manifestformat.


Anbieter wechseln

Wechseln Sie zwischen Methoden? Das Modellformat und die Umgebungsvariable ändern sich – hier ist die Übersicht:

OpenRouter → Direkter Anbieter

champollion.config.json
{
"pairs": {
"en:fr": {
- "method": "llm",
- "model": "openai/gpt-4o"
+ "method": "openai",
+ "model": "gpt-4o"
}
}
}
Environment variables
- export OPENROUTER_API_KEY=sk-or-v1-...
+ export OPENAI_API_KEY=sk-proj-...

Wesentliche Unterschiede:

  • OpenRouter verwendet das Format provider/model (z. B. openai/gpt-4o). Direkte Anbieter verwenden reine Modellnamen (z. B. gpt-4o).
  • Jeder direkte Anbieter hat seine eigene Umgebungsvariable (OPENAI_API_KEY, ANTHROPIC_API_KEY, GEMINI_API_KEY).
  • Wenn Sie das falsche Modellformat verwenden, warnt champollion Sie – siehe Modellvalidierung.

Direkter Anbieter → OpenRouter

champollion.config.json
{
"pairs": {
"en:ja": {
- "method": "anthropic",
- "model": "claude-sonnet-4-6"
+ "method": "llm",
+ "model": "anthropic/claude-sonnet-4-6"
}
}
}

:::tip Wann OpenRouter und wann direkte Anbieter verwenden Verwenden Sie OpenRouter, wenn Sie zwischen Modellen wechseln möchten, ohne Umgebungsvariablen zu ändern, oder wenn Sie mit einem einzigen Schlüssel Zugriff auf über 200 Modelle wünschen. Verwenden Sie direkte Anbieter, wenn Sie eine einfachere Abrechnung, geringere Latenz (kein Vermittler) oder Zugriff auf anbieterspezifische Funktionen wie das Prompt-Caching von Anthropic wünschen. :::


Kostenvergleich

Ungefähre Kosten pro 1.000 übersetzte Schlüssel (geht von ~10 Token pro Schlüssel, 80 Schlüssel pro Batch aus):

MethodeKosten / 1.000 SchlüsselGeschwindigkeitQualitätAm besten geeignet für
gemini (Flash)Kostenlos (innerhalb der Stufe)SchnellGutEinstieg, persönliche Projekte
google-translate~0,02 $Am schnellstenAusreichendHohes Volumen, europäische Sprachen
deepl~0,02 $SchnellGutEuropäische Sprachen, Terminologie
microsoft-translator~0,01 $SchnellAusreichendAzure-Umgebungen, breite Sprachabdeckung
libretranslateKostenlos (selbst gehostet)VariiertMäßigAir-Gapped, DSGVO, CI-Pipelines
gemini (Pro)~0,07 $MittelSehr gutQualitätssensibel, kostenloses Kontingent
openai (GPT-4o-mini)~0,01 $SchnellGutBudget-LLM
openai (GPT-4o)~0,10 $MittelSehr gutQualitätssensibel
anthropic (Haiku)~0,01 $SchnellGutBudget-LLM
anthropic (Sonnet)~0,10 $MittelSehr gutQualitätssensibel
anthropic (Opus)~0,50 $LangsamHervorragendMaximale Qualität
llm (OpenRouter)Variiert je nach ModellVariiertVariiertModellvergleich, Experimente

:::note Dies sind Schätzungen Die tatsächlichen Kosten hängen von der Länge Ihres Quelltextes, der Batch-Größe und Änderungen der Anbieterpreise ab. Prüfen Sie die aktuelle Preisseite jedes Anbieters für die genauen Tarife. :::


Siehe auch