Zum Hauptinhalt springen

champollion für Unternehmen

Ihr Team übersetzt regelmäßig Inhalte. Sie haben einen Stapel von Locale-Dateien, eine CI-Pipeline und einen Prozess, bei dem vermutlich jemand manuell Google Translate ausführt, die Ergebnisse in JSON kopiert und auf das Beste hofft. Oder Sie zahlen für eine TMS-Plattform, bei der Sie an die Übersetzungs-Engine eines einzigen Anbieters gebunden sind.

Es gibt einen besseren Weg.

Das Konzept

  1. Wählen Sie die beste Methode für jede Sprache — nicht das, was Ihr Anbieter standardmäßig vorgibt
  2. Stellen Sie mit einem einzigen Befehl bereitnpx champollion sync übersetzt jede Locale, jedes Format, jedes Mal
  3. Tauschen Sie Methoden aus, ohne Code zu ändern — eine Konfigurationsänderung, keine Migration
  4. Besitzen Sie Ihre Pipeline — kein Vendor-Lock-in, keine monatlichen Dashboards, keine Konten
champollion.config.json
{
"version": 3,
"pairs": {
"en:fr": { "method": "deepl" },
"en:ja": { "method": "llm", "model": "google/gemini-2.5-pro" },
"en:de": { "method": "google-translate" },
"en:ko": { "method": "llm", "register": "polite-haeyo" },
"en:crk": { "methodPlugin": "crk-coached-v3" }
}
}

Französisch erhält DeepL (Ihr Team bevorzugt dessen europäische Sprachgewandtheit). Japanisch erhält ein hochmodernes LLM. Deutsch erhält Google Translate (schnell, günstig, gut genug). Koreanisch erhält ein LLM mit formellem Register. Plains Cree erhält ein von der Community erstelltes, gecoachtes Plugin, das in der Bestenliste am höchsten bewertet wurde.

Derselbe Befehl. Dieselbe CI-Pipeline. Unterschiedliche Methoden pro Sprachpaar. Eine Konfigurationsdatei.

Der Workflow von der Bestenliste bis zum Deployment

:::tip Demnächst verfügbar: champollion leaderboard CLI Der nachfolgend beschriebene Workflow ist die geplante Integration zwischen der Bestenliste der MT Eval Arena und der champollion CLI. Die Infrastruktur existiert auf beiden Seiten — die Brücke befindet sich in der Entwicklung. :::

Die MT Eval Arena ist der Ort, an dem Übersetzungsmethoden mit reproduzierbarer, fingerabdruckbasierter Bewertung gemessen werden. Jede Methode erhält einen zusammengesetzten Score über mehrere Metriken hinweg (chrF++, exakte Übereinstimmung, FST-Akzeptanz, semantische Bewertung). Die Bestenliste verfolgt jede Einreichung.

Der geplante Workflow:

# Browse the leaderboard from your terminal
npx champollion leaderboard --pair en:crk

# Output:
# ┌──────┬───────────────────────┬────────────┬──────────┬───────────┐
# │ Rank │ Method │ Model │ chrF++ │ Composite │
# ├──────┼───────────────────────┼────────────┼──────────┼───────────┤
# │ 1 │ crk-coached-v3 │ gemini-2.5 │ 43.2 │ 0.67 │
# │ 2 │ fst-gated-pipeline │ gpt-4o │ 41.8 │ 0.63 │
# │ 3 │ prompt-baseline │ claude-4 │ 38.1 │ 0.55 │
# └──────┴───────────────────────┴────────────┴──────────┴───────────┘

# Install the top-scoring method as a plugin
npx champollion plugin install crk-coached-v3

# Use it
npx champollion sync

Sie bauen die Methode nicht. Sie trainieren das Modell nicht. Sie wählen den Sieger aus und stellen ihn bereit. Erscheint im nächsten Monat eine bessere Methode in der Bestenliste, tauschen Sie sie mit einem einzigen Befehl aus.

Was heute verfügbar ist

Die Brücke von der Bestenliste zur CLI befindet sich in der Entwicklung. Folgendes funktioniert bereits jetzt:

Integrierte Methoden (keine Plugins erforderlich)

MethodeAm besten geeignet fürKosten
llm (Standard)Qualitätsorientiert, jede SprachePro Token über OpenRouter
geminiQualität + kostenlose StufeKostenlos (begrenzt), danach pro Token
google-translateGeschwindigkeit + Volumen20 $/Mio. Zeichen
deeplEuropäische Sprachen25 $/Mio. Zeichen
llm-coachedSprachen mit Coaching-DatenPro Token über OpenRouter
apiBenutzerdefinierte/Community-gehostete MethodenSelbst gehostet

Plugin-Methoden (separat installieren)

Benutzerdefinierte Plugins können jede beliebige Übersetzungslogik kapseln — ein feinabgestimmtes Modell, eine FST-gesteuerte Pipeline, eine Community-API oder alles andere, das JSON erzeugt. Siehe Ein Plugin erstellen.

Unternehmens-Workflow

1. Bewerten Sie Ihre aktuelle Qualität

# See what you're getting today
npx champollion status

# Output shows: method per pair, cache hit rate, quality gate stats

2. Führen Sie das Eval-Harness an Kandidaten aus

Das Eval-Harness ermöglicht es Ihnen, mehrere Methoden gegen denselben Datensatz zu benchmarken. Führen Sie einen Durchlauf aus, vergleichen Sie Scores, wählen Sie Sieger aus:

# In the eval harness repo
python -m mt_eval_harness.run \
--methods coached-v3 baseline prompt-tuned \
--dataset data/your-corpus.json

3. Konfigurieren Sie Sieger pro Sprachpaar

Aktualisieren Sie Ihre Konfiguration, um die beste Methode pro Sprachpaar zu verwenden. Unterschiedliche Sprachen haben unterschiedliche beste Methoden — genau darum geht es.

4. In CI/CD integrieren

# In your CI pipeline
npx champollion lint # Catch hardcoded strings
npx champollion sync # Translate what changed
npx champollion audit # Fail if any locale is incomplete
npx champollion integrity # Validate placeholder consistency

Drei Befehle. Keine manuelle Übersetzung. Die Pipeline erfasst fest codierte Zeichenketten, übersetzt sie mit Ihren gewählten Methoden und lässt den Build fehlschlagen, wenn etwas fehlt oder beschädigt ist.

5. Professionelle Überprüfung (optional)

Für besonders kritische Inhalte exportieren Sie nach XLIFF für eine menschliche Überprüfung:

npx champollion xliff export --locale ja --output translations.xliff
# → Send to your translation agency
# → Import corrections back:
npx champollion xliff import translations.xliff

Lassen Sie die Masse maschinell übersetzen. Lassen Sie die kritischen Pfade durch Menschen überprüfen. Bezahlen Sie nur dort für menschliche Arbeitszeit, wo es darauf ankommt.

Kostenmodell

champollion hat keine Lizenzgebühr, kein monatliches Abonnement, keine Preisgestaltung pro Platz. Es ist ein quelloffenes CLI-Tool. Sie zahlen nur für die Aufrufe der Übersetzungs-API:

VolumenGoogle TranslateLLM (Gemini Flash)LLM (GPT-4o)
1.000 Keys × 5 Locales~0,50 $~0,30 $ (kostenlose Stufe)~2,00 $
10.000 Keys × 15 Locales~15 $~8 $~60 $
50.000 Keys × 30 Locales~75 $~40 $~300 $

Translation Memory bedeutet, dass Sie bei nachfolgenden Synchronisierungen nur für geänderte Keys zahlen. Wenn Sie 10 von 10.000 Zeichenketten aktualisieren, zahlen Sie für 10 Übersetzungen, nicht für 10.000.

vs. TMS-Plattformen

champollionCrowdin / Phrase / Locize
PreisgestaltungKostenlos (Open Source) + API-Kosten50–500 $/Monat + pro Platz
Vendor-Lock-inKeiner — Anbieter in der Konfiguration wechselnHoch — Daten in deren Cloud
MethodenwahlJeder Anbieter, jedes Modell, pro SprachpaarWas auch immer sie anbieten
CI/CDErstklassig (lint → sync → audit)Plugin/Webhook
Benutzerdefinierte MethodenPlugin-System, Community-PluginsNicht unterstützt
Qualitäts-GateIntegriert (falsches Skript, Echo, Länge)Variiert
Selbst gehostetJa (LibreTranslate, benutzerdefinierte API)Nein

Siehe den vollständigen Vergleich für Details.

Weiterführende Literatur