Champollion so với các công cụ khác
Champollion thuộc một phân khúc khác so với hầu hết các công cụ bản địa hóa. Dưới đây là một so sánh khách quan.
Toàn cảnh các công cụ
Hầu hết các công cụ bản địa hóa đều thuộc một trong ba nhóm sau:
| Phân loại | Ví dụ | Mô hình |
|---|---|---|
| Nền tảng TMS đám mây | Crowdin, Phrase, Locize, Tolgee | Dashboard SaaS + biên dịch viên con người + đăng ký thuê bao hàng tháng |
| Công cụ trích xuất khóa (Key) | i18next-scanner, FormatJS CLI | Quét mã nguồn để tìm các lệnh gọi hàm dịch thuật |
| Công cụ dịch thuật qua CLI | champollion | Chạy trực tiếp trong dự án, dịch tệp trực tiếp, không cần tài khoản đám mây |
Champollion là một công cụ dịch thuật qua CLI — nó dịch trực tiếp các tệp ngôn ngữ (locale) của bạn bằng cách sử dụng các backend có thể cấu hình (LLM, Google Translate, plugin tùy chỉnh). Không cần dashboard đám mây, không cần quy trình làm việc với biên dịch viên, không tốn phí hàng tháng.
So sánh tính năng
| Tính năng | champollion | Crowdin | Phrase | Locize |
|---|---|---|---|---|
| Chạy cục bộ (không cần tài khoản đám mây) | ✅ | ❌ | ❌ | ❌ |
| Không phụ thuộc (Zero dependencies) | ✅ | ❌ | ❌ | ❌ |
| Cấu hình phương thức dịch cho từng cặp ngôn ngữ | ✅ | ❌ | ❌ | ❌ |
| Tùy chỉnh văn phong ngôn ngữ (register) | ✅ | ❌ | ❌ | ❌ |
| Nhận biết nội dung (bảo vệ các khối mã) | ✅ | ❌ | ❌ | ❌ |
| Chuyển đổi hệ chữ viết & ngôn ngữ nhân tạo (conlang) | ✅ | ❌ | ❌ | ❌ |
| Kiến trúc plugin | ✅ | ❌ | ❌ | ❌ |
| Dịch Markdown / nội dung | ✅ | ✅ | ✅ | ❌ |
| Bộ nhớ dịch thuật (Translation Memory) | ✅ | ✅ | ✅ | ✅ |
| Xuất/nhập XLIFF | ✅ | ✅ | ✅ | ❌ |
| Xác thực dạng số nhiều ICU | ✅ | ✅ | ✅ | ❌ |
| Áp dụng thuật ngữ bắt buộc | ✅ | ✅ | ✅ | ❌ |
| Quy trình làm việc với biên dịch viên | Dựa trên XLIFF | ✅ | ✅ | ✅ |
| Chỉnh sửa trực quan theo ngữ cảnh (in-context) | ❌ | ✅ | ✅ | ✅ |
| Cộng tác nhóm | ❌ | ✅ | ✅ | ✅ |
| Hỗ trợ định dạng tệp | JSON, TOML, YAML, MD, XLIFF | 50+ | 40+ | JSON |
| Giá cả | Miễn phí (chỉ trả phí cho LLM của bạn) | Từ $0/tháng | Từ $0/tháng | Từ $0/tháng |
Khi nào nên dùng Champollion
Champollion là lựa chọn phù hợp khi:
- Bạn muốn tích hợp dịch máy trực tiếp vào quy trình build (build pipeline) — chứ không phải là một quy trình làm việc riêng biệt
- Bạn cần kiểm soát phương thức dịch cho từng ngôn ngữ (dùng LLM cho một số ngôn ngữ, Google Translate cho ngôn ngữ khác, và plugin tùy chỉnh cho phần còn lại)
- Bạn đang dịch sang các ngôn ngữ chưa được các API phổ biến hỗ trợ (ngôn ngữ bản địa, ngôn ngữ có nguy cơ mai một, ngôn ngữ nhân tạo)
- Bạn muốn đầu ra chữ viết có tính định trước (Chữ viết âm tiết Cree, chữ pIqaD của người Klingon, chữ Tengwar)
- Bạn muốn hoàn toàn không bị ràng buộc bởi nhà cung cấp (vendor lock-in) và không phụ thuộc vào đám mây
- Bạn là nhà phát triển độc lập hoặc đội ngũ nhỏ không cần đến một dashboard TMS đầy đủ
- Bạn muốn bàn giao file định dạng XLIFF cho biên dịch viên chuyên nghiệp mà không cần đăng ký thuê bao đám mây
Hệ thống TMS đám mây sẽ phù hợp hơn khi:
- Bạn có biên dịch viên chuyên nghiệp soát lỗi từng chuỗi văn bản (quy trình XLIFF của Champollion đơn giản hơn một TMS đầy đủ)
- Bạn cần quản lý bộ nhớ dịch thuật và thuật ngữ chung (glossary) giữa nhiều dự án
- Bạn cần chỉnh sửa trực quan theo ngữ cảnh (xem trước bản dịch trực tiếp trên giao diện người dùng)
- Bạn có một đội ngũ lớn với nhu cầu phân quyền truy cập theo vai trò (RBAC)
- Bạn cần hỗ trợ hơn 50 định dạng tệp khác nhau
Những gì Champollion làm được mà không công cụ nào khác làm được
1. Tùy chỉnh văn phong (Custom Registers)
Mỗi cặp ngôn ngữ đều nhận được các hướng dẫn về giọng điệu (tone) phù hợp với văn hóa dành cho LLM:
{
"de": {
"register": "Standard professional register. Use Sie-form for formal address."
},
"tl": {
"register": "Educated Manila Taglish. Use Tagalog as the primary language but keep technical terms in English."
},
"tlh": {
"register": "Warrior's honor. OVS grammar. Use Marc Okrand vocabulary."
}
}
Không có công cụ nào khác cung cấp sẵn 47 văn phong ngôn ngữ được cấu hình trước, hoặc cho phép bạn tự định nghĩa các văn phong tùy chỉnh cho từng dự án.
2. Bộ chuyển đổi chữ viết có tính định trước (Deterministic Script Converters)
Champollion đi kèm với năm bộ chuyển đổi chữ viết tích hợp sẵn, chạy dưới dạng các hook sau dịch thuật (post-translation hook) — không cần đến LLM:
| Mã ngôn ngữ (Locale) | Chuyển đổi | Ví dụ |
|---|---|---|
crk | SRO → Chữ viết âm tiết Cree | nêhiyawêwin → ᓀᐦᐃᔭᐍᐏᐣ |
sr | Latin → Cyrillic | Beograd → Београд |
tlh | Phiên âm Latin → pIqaD | tlhIngan Hol → (ký tự pIqaD) |
x-elvish-s | Latin → Tengwar | Sindarin → Tengwar (Chế độ Beleriand) |
x-kryptonian | Latin → Kryptonian | Thay thế bằng mật mã (yêu cầu font chữ) |
Đây là các bộ chuyển đổi dựa trên bảng tra cứu thuần túy — có tính định trước, có thể kiểm tra được và hoàn toàn không có nguy cơ bị ảo giác (hallucination) từ LLM.
3. Bảo vệ nội dung thông minh (Content-Aware Shielding)
Khi dịch Markdown hoặc nội dung đa định dạng (rich content), Champollion sẽ bảo vệ:
- Các khối mã (fenced code block) (
```) - Mã nội dòng (inline code) (
` `) - Các shortcode của Hugo (
{{</* */>}},{{%/* */%}}) - Các biến nội suy (interpolation variable) (
{{ .Count }},{name},{{t('key')}}) - Các khối HTML thô (raw HTML)
Chúng được thay thế bằng các token lính canh (sentinel token) Unicode trước khi dịch và được khôi phục lại sau đó. LLM sẽ không bao giờ nhìn thấy mã nguồn, shortcode hay các biến của bạn.
4. Plugin phương thức dịch có hướng dẫn (Coached Method Plugins)
Đối với các ngôn ngữ chưa được hỗ trợ bởi các API dịch thuật, bạn có thể xây dựng một phương thức dịch có hướng dẫn (coached translation):
- Viết dữ liệu hướng dẫn ngôn ngữ (quy tắc ngữ pháp, từ vựng, ví dụ)
- Đóng gói nó thành một plugin
- Đánh giá hiệu năng (benchmark) so với các bản dịch tham chiếu bằng cách sử dụng hệ thống đánh giá (eval harness)
- Cài đặt vào dự án của bạn bằng lệnh
champollion plugin install
Đây là cách Champollion xử lý tiếng Plains Cree — và cũng là cách bạn có thể xử lý bất kỳ ngôn ngữ nào, kể cả những ngôn ngữ chưa từng tồn tại.
Kết luận
Champollion không phải là công cụ thay thế cho Crowdin. Đây là một công cụ khác dành cho một quy trình làm việc khác. Nếu bạn cần biên dịch viên con người, hãy sử dụng một hệ thống TMS. Nếu bạn cần một công cụ CLI giúp dịch các tệp của mình chỉ bằng một lệnh duy nhất và cho phép bạn kiểm soát phương thức, mô hình và văn phong cho từng ngôn ngữ — hãy sử dụng Champollion.