Chuyển đến nội dung chính

Champollion so với các công cụ khác

Champollion thuộc một phân khúc khác so với hầu hết các công cụ bản địa hóa. Dưới đây là một so sánh khách quan.

Toàn cảnh các công cụ

Hầu hết các công cụ bản địa hóa đều thuộc một trong ba nhóm sau:

Phân loạiVí dụMô hình
Nền tảng TMS đám mâyCrowdin, Phrase, Locize, TolgeeDashboard SaaS + biên dịch viên con người + đăng ký thuê bao hàng tháng
Công cụ trích xuất khóa (Key)i18next-scanner, FormatJS CLIQuét mã nguồn để tìm các lệnh gọi hàm dịch thuật
Công cụ dịch thuật qua CLIchampollionChạy trực tiếp trong dự án, dịch tệp trực tiếp, không cần tài khoản đám mây

Champollion là một công cụ dịch thuật qua CLI — nó dịch trực tiếp các tệp ngôn ngữ (locale) của bạn bằng cách sử dụng các backend có thể cấu hình (LLM, Google Translate, plugin tùy chỉnh). Không cần dashboard đám mây, không cần quy trình làm việc với biên dịch viên, không tốn phí hàng tháng.


So sánh tính năng

Tính năngchampollionCrowdinPhraseLocize
Chạy cục bộ (không cần tài khoản đám mây)
Không phụ thuộc (Zero dependencies)
Cấu hình phương thức dịch cho từng cặp ngôn ngữ
Tùy chỉnh văn phong ngôn ngữ (register)
Nhận biết nội dung (bảo vệ các khối mã)
Chuyển đổi hệ chữ viết & ngôn ngữ nhân tạo (conlang)
Kiến trúc plugin
Dịch Markdown / nội dung
Bộ nhớ dịch thuật (Translation Memory)
Xuất/nhập XLIFF
Xác thực dạng số nhiều ICU
Áp dụng thuật ngữ bắt buộc
Quy trình làm việc với biên dịch viênDựa trên XLIFF
Chỉnh sửa trực quan theo ngữ cảnh (in-context)
Cộng tác nhóm
Hỗ trợ định dạng tệpJSON, TOML, YAML, MD, XLIFF50+40+JSON
Giá cảMiễn phí (chỉ trả phí cho LLM của bạn)Từ $0/thángTừ $0/thángTừ $0/tháng

Khi nào nên dùng Champollion

Champollion là lựa chọn phù hợp khi:

  • Bạn muốn tích hợp dịch máy trực tiếp vào quy trình build (build pipeline) — chứ không phải là một quy trình làm việc riêng biệt
  • Bạn cần kiểm soát phương thức dịch cho từng ngôn ngữ (dùng LLM cho một số ngôn ngữ, Google Translate cho ngôn ngữ khác, và plugin tùy chỉnh cho phần còn lại)
  • Bạn đang dịch sang các ngôn ngữ chưa được các API phổ biến hỗ trợ (ngôn ngữ bản địa, ngôn ngữ có nguy cơ mai một, ngôn ngữ nhân tạo)
  • Bạn muốn đầu ra chữ viết có tính định trước (Chữ viết âm tiết Cree, chữ pIqaD của người Klingon, chữ Tengwar)
  • Bạn muốn hoàn toàn không bị ràng buộc bởi nhà cung cấp (vendor lock-in) và không phụ thuộc vào đám mây
  • Bạn là nhà phát triển độc lập hoặc đội ngũ nhỏ không cần đến một dashboard TMS đầy đủ
  • Bạn muốn bàn giao file định dạng XLIFF cho biên dịch viên chuyên nghiệp mà không cần đăng ký thuê bao đám mây

Hệ thống TMS đám mây sẽ phù hợp hơn khi:

  • Bạn có biên dịch viên chuyên nghiệp soát lỗi từng chuỗi văn bản (quy trình XLIFF của Champollion đơn giản hơn một TMS đầy đủ)
  • Bạn cần quản lý bộ nhớ dịch thuật và thuật ngữ chung (glossary) giữa nhiều dự án
  • Bạn cần chỉnh sửa trực quan theo ngữ cảnh (xem trước bản dịch trực tiếp trên giao diện người dùng)
  • Bạn có một đội ngũ lớn với nhu cầu phân quyền truy cập theo vai trò (RBAC)
  • Bạn cần hỗ trợ hơn 50 định dạng tệp khác nhau

Những gì Champollion làm được mà không công cụ nào khác làm được

1. Tùy chỉnh văn phong (Custom Registers)

Mỗi cặp ngôn ngữ đều nhận được các hướng dẫn về giọng điệu (tone) phù hợp với văn hóa dành cho LLM:

{
"de": {
"register": "Standard professional register. Use Sie-form for formal address."
},
"tl": {
"register": "Educated Manila Taglish. Use Tagalog as the primary language but keep technical terms in English."
},
"tlh": {
"register": "Warrior's honor. OVS grammar. Use Marc Okrand vocabulary."
}
}

Không có công cụ nào khác cung cấp sẵn 47 văn phong ngôn ngữ được cấu hình trước, hoặc cho phép bạn tự định nghĩa các văn phong tùy chỉnh cho từng dự án.

2. Bộ chuyển đổi chữ viết có tính định trước (Deterministic Script Converters)

Champollion đi kèm với năm bộ chuyển đổi chữ viết tích hợp sẵn, chạy dưới dạng các hook sau dịch thuật (post-translation hook) — không cần đến LLM:

Mã ngôn ngữ (Locale)Chuyển đổiVí dụ
crkSRO → Chữ viết âm tiết Creenêhiyawêwinᓀᐦᐃᔭᐍᐏᐣ
srLatin → CyrillicBeogradБеоград
tlhPhiên âm Latin → pIqaDtlhIngan Hol → (ký tự pIqaD)
x-elvish-sLatin → TengwarSindarin → Tengwar (Chế độ Beleriand)
x-kryptonianLatin → KryptonianThay thế bằng mật mã (yêu cầu font chữ)

Đây là các bộ chuyển đổi dựa trên bảng tra cứu thuần túy — có tính định trước, có thể kiểm tra được và hoàn toàn không có nguy cơ bị ảo giác (hallucination) từ LLM.

3. Bảo vệ nội dung thông minh (Content-Aware Shielding)

Khi dịch Markdown hoặc nội dung đa định dạng (rich content), Champollion sẽ bảo vệ:

  • Các khối mã (fenced code block) (```)
  • Mã nội dòng (inline code) (` `)
  • Các shortcode của Hugo ({{</* */>}}, {{%/* */%}})
  • Các biến nội suy (interpolation variable) ({{ .Count }}, {name}, {{t('key')}})
  • Các khối HTML thô (raw HTML)

Chúng được thay thế bằng các token lính canh (sentinel token) Unicode trước khi dịch và được khôi phục lại sau đó. LLM sẽ không bao giờ nhìn thấy mã nguồn, shortcode hay các biến của bạn.

4. Plugin phương thức dịch có hướng dẫn (Coached Method Plugins)

Đối với các ngôn ngữ chưa được hỗ trợ bởi các API dịch thuật, bạn có thể xây dựng một phương thức dịch có hướng dẫn (coached translation):

  1. Viết dữ liệu hướng dẫn ngôn ngữ (quy tắc ngữ pháp, từ vựng, ví dụ)
  2. Đóng gói nó thành một plugin
  3. Đánh giá hiệu năng (benchmark) so với các bản dịch tham chiếu bằng cách sử dụng hệ thống đánh giá (eval harness)
  4. Cài đặt vào dự án của bạn bằng lệnh champollion plugin install

Đây là cách Champollion xử lý tiếng Plains Cree — và cũng là cách bạn có thể xử lý bất kỳ ngôn ngữ nào, kể cả những ngôn ngữ chưa từng tồn tại.


Kết luận

Champollion không phải là công cụ thay thế cho Crowdin. Đây là một công cụ khác dành cho một quy trình làm việc khác. Nếu bạn cần biên dịch viên con người, hãy sử dụng một hệ thống TMS. Nếu bạn cần một công cụ CLI giúp dịch các tệp của mình chỉ bằng một lệnh duy nhất và cho phép bạn kiểm soát phương thức, mô hình và văn phong cho từng ngôn ngữ — hãy sử dụng Champollion.