champollion cho Doanh nghiệp

Đội ngũ của bạn dịch thuật nội dung thường xuyên. Bạn có một tập hợp các tệp ngôn ngữ (locale files), một pipeline CI, và một quy trình có lẽ bao gồm việc ai đó phải chạy Google Translate thủ công, sao chép kết quả vào tệp JSON và hy vọng mọi thứ suôn sẻ. Hoặc bạn đang trả tiền cho một nền tảng TMS nơi bạn bị ràng buộc vào công cụ dịch thuật của một nhà cung cấp duy nhất.

Có một cách tốt hơn.

Lợi thế cốt lõi

Chọn phương pháp tốt nhất cho từng ngôn ngữ — không phụ thuộc vào thiết lập mặc định của nhà cung cấp
Triển khai chỉ với một câu lệnh — npx champollion sync dịch mọi ngôn ngữ, mọi định dạng, mọi lúc
Thay đổi phương pháp không cần sửa mã nguồn — chỉ cần thay đổi cấu hình, không cần di trú dữ liệu
Làm chủ pipeline của bạn — không bị ràng buộc bởi nhà cung cấp, không có bảng điều khiển hàng tháng, không cần tài khoản

champollion.config.json
{
  "version": 3,
  "pairs": {
    "en:fr": { "method": "deepl" },
    "en:ja": { "method": "llm", "model": "google/gemini-2.5-pro" },
    "en:de": { "method": "google-translate" },
    "en:ko": { "method": "llm", "register": "polite-haeyo" },
    "en:crk": { "methodPlugin": "crk-coached-v3" }
  }
}

Tiếng Pháp dùng DeepL (đội ngũ của bạn thích sự lưu loát theo phong cách châu Âu của nó). Tiếng Nhật dùng một LLM tiên tiến (frontier LLM). Tiếng Đức dùng Google Translate (nhanh, rẻ, đủ tốt). Tiếng Hàn dùng một LLM với văn phong trang trọng. Tiếng Plains Cree dùng một plugin được huấn luyện (coached plugin) do cộng đồng xây dựng đạt điểm cao nhất trên bảng xếp hạng.

Cùng một câu lệnh. Cùng một pipeline CI. Các phương pháp khác nhau cho từng cặp ngôn ngữ. Chỉ một tệp cấu hình.

Quy trình từ Bảng xếp hạng → Triển khai

:::tip Sắp ra mắt: champollion leaderboard CLI Quy trình làm việc được mô tả dưới đây là sự tích hợp dự kiến giữa bảng xếp hạng MT Eval Arena và champollion CLI. Cơ sở hạ tầng đã sẵn sàng ở cả hai phía — cầu nối đang được phát triển. :::

MT Eval Arena là nơi các phương pháp dịch thuật được đánh giá hiệu năng (benchmark) với điểm số có thể tái lập và được định danh (fingerprinted). Mỗi phương pháp nhận được một điểm số tổng hợp dựa trên nhiều chỉ số (chrF++, khớp chính xác, chấp nhận FST, đánh giá ngữ nghĩa). Bảng xếp hạng theo dõi mọi lượt gửi đánh giá.

Quy trình dự kiến:

# Browse the leaderboard from your terminal
npx champollion leaderboard --pair en:crk

# Output:
# ┌──────┬───────────────────────┬────────────┬──────────┬───────────┐
# │ Rank │ Method                │ Model      │ chrF++   │ Composite │
# ├──────┼───────────────────────┼────────────┼──────────┼───────────┤
# │  1   │ crk-coached-v3        │ gemini-2.5 │ 43.2     │ 0.67      │
# │  2   │ fst-gated-pipeline    │ gpt-4o     │ 41.8     │ 0.63      │
# │  3   │ prompt-baseline       │ claude-4   │ 38.1     │ 0.55      │
# └──────┴───────────────────────┴────────────┴──────────┴───────────┘

# Install the top-scoring method as a plugin
npx champollion plugin install crk-coached-v3

# Use it
npx champollion sync

Bạn không cần xây dựng phương pháp. Bạn không cần huấn luyện mô hình. Bạn chỉ cần chọn phương án chiến thắng và triển khai. Nếu một phương pháp tốt hơn xuất hiện trên bảng xếp hạng vào tháng tới, bạn có thể thay thế nó chỉ bằng một câu lệnh.

Những tính năng hiện có

Cầu nối từ bảng xếp hạng đến CLI đang được phát triển. Dưới đây là những gì hoạt động ngay lúc này:

Các phương pháp tích hợp sẵn (không cần plugin)

Phương pháp	Phù hợp nhất cho	Chi phí
`llm` (mặc định)	Tập trung vào chất lượng, mọi ngôn ngữ	Theo token qua OpenRouter
`gemini`	Chất lượng + gói miễn phí	Miễn phí (giới hạn), sau đó theo token
`google-translate`	Tốc độ + số lượng lớn	$20/triệu ký tự
`deepl`	Các ngôn ngữ châu Âu	$25/triệu ký tự
`llm-coached`	Các ngôn ngữ có dữ liệu huấn luyện (coaching data)	Theo token qua OpenRouter
`api`	Các phương pháp tùy chỉnh/do cộng đồng lưu trữ	Tự lưu trữ (Self-hosted)

Các phương pháp dạng plugin (cài đặt riêng biệt)

Các plugin tùy chỉnh có thể đóng gói bất kỳ logic dịch thuật nào — một mô hình đã được tinh chỉnh (fine-tuned), một pipeline được kiểm soát bởi FST, một API cộng đồng, hoặc bất kỳ thứ gì khác tạo ra kết quả JSON. Xem Xây dựng một Plugin.

Quy trình làm việc cho Doanh nghiệp

1. Đánh giá chất lượng hiện tại của bạn

# See what you're getting today
npx champollion status

# Output shows: method per pair, cache hit rate, quality gate stats

2. Chạy bộ công cụ đánh giá (eval harness) trên các ứng viên

Bộ công cụ đánh giá (eval harness) cho phép bạn đánh giá hiệu năng của nhiều phương pháp trên cùng một tập dữ liệu. Chạy thử nghiệm hàng loạt, so sánh điểm số, chọn ra phương án chiến thắng:

# In the eval harness repo
python -m mt_eval_harness.run \
  --methods coached-v3 baseline prompt-tuned \
  --dataset data/your-corpus.json

3. Cấu hình phương án chiến thắng cho từng cặp ngôn ngữ

Cập nhật cấu hình của bạn để sử dụng phương pháp tốt nhất cho từng cặp ngôn ngữ. Các ngôn ngữ khác nhau có các phương pháp tối ưu khác nhau — đó chính là điểm mấu chốt.

4. Tích hợp vào CI/CD

# In your CI pipeline
npx champollion lint        # Catch hardcoded strings
npx champollion sync        # Translate what changed
npx champollion audit       # Fail if any locale is incomplete
npx champollion integrity   # Validate placeholder consistency

Ba câu lệnh. Không cần dịch thuật thủ công. Pipeline sẽ phát hiện các chuỗi ký tự bị viết cứng (hardcoded), dịch chúng bằng các phương pháp bạn đã chọn, và báo lỗi bản build nếu có bất kỳ thứ gì bị thiếu hoặc bị hỏng.

5. Đánh giá chuyên nghiệp (tùy chọn)

Đối với nội dung quan trọng, hãy xuất sang định dạng XLIFF để con người đánh giá:

npx champollion xliff export --locale ja --output translations.xliff
# → Send to your translation agency
# → Import corrections back:
npx champollion xliff import translations.xliff

Dịch máy số lượng lớn. Con người đánh giá các phần quan trọng. Chỉ trả tiền cho thời gian của con người ở những nơi thực sự cần thiết.

Mô hình chi phí

champollion không có phí bản quyền, không có gói đăng ký hàng tháng, không tính phí theo số lượng người dùng. Đây là một công cụ CLI mã nguồn mở. Bạn chỉ trả tiền cho các lượt gọi API dịch thuật:

Số lượng	Google Translate	LLM (Gemini Flash)	LLM (GPT-4o)
1.000 key × 5 ngôn ngữ	~$0,50	~$0,30 (gói miễn phí)	~$2,00
10.000 key × 15 ngôn ngữ	~$15	~$8	~$60
50.000 key × 30 ngôn ngữ	~$75	~$40	~$300

Bộ nhớ dịch thuật (Translation Memory) giúp bạn chỉ phải trả tiền cho các key đã thay đổi trong các lần đồng bộ tiếp theo. Nếu bạn cập nhật 10 chuỗi ký tự trong số 10.000 chuỗi, bạn chỉ trả tiền cho 10 bản dịch, chứ không phải 10.000.

So sánh với các nền tảng TMS

	champollion	Crowdin / Phrase / Locize
Giá cả	Miễn phí (mã nguồn mở) + chi phí API	$50–$500/tháng + tính theo người dùng
Ràng buộc nhà cung cấp	Không — chuyển đổi nhà cung cấp trong cấu hình	Cao — dữ liệu nằm trên đám mây của họ
Lựa chọn phương pháp	Bất kỳ nhà cung cấp nào, bất kỳ mô hình nào, cho từng cặp ngôn ngữ	Chỉ những gì họ cung cấp
CI/CD	Tích hợp sâu sắc (`lint → sync → audit`)	Plugin/webhook
Phương pháp tùy chỉnh	Hệ thống plugin, plugin cộng đồng	Không hỗ trợ
Kiểm soát chất lượng (Quality gate)	Tích hợp sẵn (sai hệ chữ viết, lặp từ, độ dài)	Khác nhau tùy nền tảng
Tự lưu trữ (Self-hosted)	Có (LibreTranslate, API tùy chỉnh)	Không

Xem bản so sánh đầy đủ để biết thêm chi tiết.

Tài liệu đọc thêm

Bắt đầu nhanh — chạy lần đồng bộ đầu tiên của bạn trong 60 giây
Các phương pháp dịch thuật — danh mục phương pháp đầy đủ kèm theo sơ đồ quyết định
Tích hợp CI/CD — tự động hóa trong pipeline của bạn
Làm việc với Biên dịch viên chuyên nghiệp — xuất/nhập tệp XLIFF
MT Eval Arena — đánh giá hiệu năng và bảng xếp hạng
Tài liệu tham khảo cấu hình — tất cả các tùy chọn cấu hình

Lợi thế cốt lõi​

Quy trình từ Bảng xếp hạng → Triển khai​

Những tính năng hiện có​

Các phương pháp tích hợp sẵn (không cần plugin)​

Các phương pháp dạng plugin (cài đặt riêng biệt)​

Quy trình làm việc cho Doanh nghiệp​

1. Đánh giá chất lượng hiện tại của bạn​

2. Chạy bộ công cụ đánh giá (eval harness) trên các ứng viên​

3. Cấu hình phương án chiến thắng cho từng cặp ngôn ngữ​

4. Tích hợp vào CI/CD​

5. Đánh giá chuyên nghiệp (tùy chọn)​

Mô hình chi phí​

So sánh với các nền tảng TMS​

Tài liệu đọc thêm​