Chuyển đến nội dung chính

champollion cho Doanh nghiệp

Đội ngũ của bạn dịch thuật nội dung thường xuyên. Bạn có một tập hợp các tệp ngôn ngữ (locale files), một pipeline CI, và một quy trình có lẽ bao gồm việc ai đó phải chạy Google Translate thủ công, sao chép kết quả vào tệp JSON và hy vọng mọi thứ suôn sẻ. Hoặc bạn đang trả tiền cho một nền tảng TMS nơi bạn bị ràng buộc vào công cụ dịch thuật của một nhà cung cấp duy nhất.

Có một cách tốt hơn.

Lợi thế cốt lõi

  1. Chọn phương pháp tốt nhất cho từng ngôn ngữ — không phụ thuộc vào thiết lập mặc định của nhà cung cấp
  2. Triển khai chỉ với một câu lệnhnpx champollion sync dịch mọi ngôn ngữ, mọi định dạng, mọi lúc
  3. Thay đổi phương pháp không cần sửa mã nguồn — chỉ cần thay đổi cấu hình, không cần di trú dữ liệu
  4. Làm chủ pipeline của bạn — không bị ràng buộc bởi nhà cung cấp, không có bảng điều khiển hàng tháng, không cần tài khoản
champollion.config.json
{
"version": 3,
"pairs": {
"en:fr": { "method": "deepl" },
"en:ja": { "method": "llm", "model": "google/gemini-2.5-pro" },
"en:de": { "method": "google-translate" },
"en:ko": { "method": "llm", "register": "polite-haeyo" },
"en:crk": { "methodPlugin": "crk-coached-v3" }
}
}

Tiếng Pháp dùng DeepL (đội ngũ của bạn thích sự lưu loát theo phong cách châu Âu của nó). Tiếng Nhật dùng một LLM tiên tiến (frontier LLM). Tiếng Đức dùng Google Translate (nhanh, rẻ, đủ tốt). Tiếng Hàn dùng một LLM với văn phong trang trọng. Tiếng Plains Cree dùng một plugin được huấn luyện (coached plugin) do cộng đồng xây dựng đạt điểm cao nhất trên bảng xếp hạng.

Cùng một câu lệnh. Cùng một pipeline CI. Các phương pháp khác nhau cho từng cặp ngôn ngữ. Chỉ một tệp cấu hình.

Quy trình từ Bảng xếp hạng → Triển khai

:::tip Sắp ra mắt: champollion leaderboard CLI Quy trình làm việc được mô tả dưới đây là sự tích hợp dự kiến giữa bảng xếp hạng MT Eval Arena và champollion CLI. Cơ sở hạ tầng đã sẵn sàng ở cả hai phía — cầu nối đang được phát triển. :::

MT Eval Arena là nơi các phương pháp dịch thuật được đánh giá hiệu năng (benchmark) với điểm số có thể tái lập và được định danh (fingerprinted). Mỗi phương pháp nhận được một điểm số tổng hợp dựa trên nhiều chỉ số (chrF++, khớp chính xác, chấp nhận FST, đánh giá ngữ nghĩa). Bảng xếp hạng theo dõi mọi lượt gửi đánh giá.

Quy trình dự kiến:

# Browse the leaderboard from your terminal
npx champollion leaderboard --pair en:crk

# Output:
# ┌──────┬───────────────────────┬────────────┬──────────┬───────────┐
# │ Rank │ Method │ Model │ chrF++ │ Composite │
# ├──────┼───────────────────────┼────────────┼──────────┼───────────┤
# │ 1 │ crk-coached-v3 │ gemini-2.5 │ 43.2 │ 0.67 │
# │ 2 │ fst-gated-pipeline │ gpt-4o │ 41.8 │ 0.63 │
# │ 3 │ prompt-baseline │ claude-4 │ 38.1 │ 0.55 │
# └──────┴───────────────────────┴────────────┴──────────┴───────────┘

# Install the top-scoring method as a plugin
npx champollion plugin install crk-coached-v3

# Use it
npx champollion sync

Bạn không cần xây dựng phương pháp. Bạn không cần huấn luyện mô hình. Bạn chỉ cần chọn phương án chiến thắng và triển khai. Nếu một phương pháp tốt hơn xuất hiện trên bảng xếp hạng vào tháng tới, bạn có thể thay thế nó chỉ bằng một câu lệnh.

Những tính năng hiện có

Cầu nối từ bảng xếp hạng đến CLI đang được phát triển. Dưới đây là những gì hoạt động ngay lúc này:

Các phương pháp tích hợp sẵn (không cần plugin)

Phương phápPhù hợp nhất choChi phí
llm (mặc định)Tập trung vào chất lượng, mọi ngôn ngữTheo token qua OpenRouter
geminiChất lượng + gói miễn phíMiễn phí (giới hạn), sau đó theo token
google-translateTốc độ + số lượng lớn$20/triệu ký tự
deeplCác ngôn ngữ châu Âu$25/triệu ký tự
llm-coachedCác ngôn ngữ có dữ liệu huấn luyện (coaching data)Theo token qua OpenRouter
apiCác phương pháp tùy chỉnh/do cộng đồng lưu trữTự lưu trữ (Self-hosted)

Các phương pháp dạng plugin (cài đặt riêng biệt)

Các plugin tùy chỉnh có thể đóng gói bất kỳ logic dịch thuật nào — một mô hình đã được tinh chỉnh (fine-tuned), một pipeline được kiểm soát bởi FST, một API cộng đồng, hoặc bất kỳ thứ gì khác tạo ra kết quả JSON. Xem Xây dựng một Plugin.

Quy trình làm việc cho Doanh nghiệp

1. Đánh giá chất lượng hiện tại của bạn

# See what you're getting today
npx champollion status

# Output shows: method per pair, cache hit rate, quality gate stats

2. Chạy bộ công cụ đánh giá (eval harness) trên các ứng viên

Bộ công cụ đánh giá (eval harness) cho phép bạn đánh giá hiệu năng của nhiều phương pháp trên cùng một tập dữ liệu. Chạy thử nghiệm hàng loạt, so sánh điểm số, chọn ra phương án chiến thắng:

# In the eval harness repo
python -m mt_eval_harness.run \
--methods coached-v3 baseline prompt-tuned \
--dataset data/your-corpus.json

3. Cấu hình phương án chiến thắng cho từng cặp ngôn ngữ

Cập nhật cấu hình của bạn để sử dụng phương pháp tốt nhất cho từng cặp ngôn ngữ. Các ngôn ngữ khác nhau có các phương pháp tối ưu khác nhau — đó chính là điểm mấu chốt.

4. Tích hợp vào CI/CD

# In your CI pipeline
npx champollion lint # Catch hardcoded strings
npx champollion sync # Translate what changed
npx champollion audit # Fail if any locale is incomplete
npx champollion integrity # Validate placeholder consistency

Ba câu lệnh. Không cần dịch thuật thủ công. Pipeline sẽ phát hiện các chuỗi ký tự bị viết cứng (hardcoded), dịch chúng bằng các phương pháp bạn đã chọn, và báo lỗi bản build nếu có bất kỳ thứ gì bị thiếu hoặc bị hỏng.

5. Đánh giá chuyên nghiệp (tùy chọn)

Đối với nội dung quan trọng, hãy xuất sang định dạng XLIFF để con người đánh giá:

npx champollion xliff export --locale ja --output translations.xliff
# → Send to your translation agency
# → Import corrections back:
npx champollion xliff import translations.xliff

Dịch máy số lượng lớn. Con người đánh giá các phần quan trọng. Chỉ trả tiền cho thời gian của con người ở những nơi thực sự cần thiết.

Mô hình chi phí

champollion không có phí bản quyền, không có gói đăng ký hàng tháng, không tính phí theo số lượng người dùng. Đây là một công cụ CLI mã nguồn mở. Bạn chỉ trả tiền cho các lượt gọi API dịch thuật:

Số lượngGoogle TranslateLLM (Gemini Flash)LLM (GPT-4o)
1.000 key × 5 ngôn ngữ~$0,50~$0,30 (gói miễn phí)~$2,00
10.000 key × 15 ngôn ngữ~$15~$8~$60
50.000 key × 30 ngôn ngữ~$75~$40~$300

Bộ nhớ dịch thuật (Translation Memory) giúp bạn chỉ phải trả tiền cho các key đã thay đổi trong các lần đồng bộ tiếp theo. Nếu bạn cập nhật 10 chuỗi ký tự trong số 10.000 chuỗi, bạn chỉ trả tiền cho 10 bản dịch, chứ không phải 10.000.

So sánh với các nền tảng TMS

champollionCrowdin / Phrase / Locize
Giá cảMiễn phí (mã nguồn mở) + chi phí API$50–$500/tháng + tính theo người dùng
Ràng buộc nhà cung cấpKhông — chuyển đổi nhà cung cấp trong cấu hìnhCao — dữ liệu nằm trên đám mây của họ
Lựa chọn phương phápBất kỳ nhà cung cấp nào, bất kỳ mô hình nào, cho từng cặp ngôn ngữChỉ những gì họ cung cấp
CI/CDTích hợp sâu sắc (lint → sync → audit)Plugin/webhook
Phương pháp tùy chỉnhHệ thống plugin, plugin cộng đồngKhông hỗ trợ
Kiểm soát chất lượng (Quality gate)Tích hợp sẵn (sai hệ chữ viết, lặp từ, độ dài)Khác nhau tùy nền tảng
Tự lưu trữ (Self-hosted)Có (LibreTranslate, API tùy chỉnh)Không

Xem bản so sánh đầy đủ để biết thêm chi tiết.

Tài liệu đọc thêm