champollion สำหรับองค์กร
ทีมของคุณแปลเนื้อหาเป็นประจำ คุณมีไฟล์ locale สะสมอยู่ มี CI pipeline และกระบวนการที่อาจเกี่ยวข้องกับการที่ใครบางคนรัน Google Translate ด้วยตนเอง คัดลอกผลลัพธ์ลงใน JSON แล้วก็หวังว่าทุกอย่างจะเรียบร้อย หรือไม่ก็คุณกำลังจ่ายเงินให้แพลตฟอร์ม TMS ที่ผูกติดคุณไว้กับ translation engine ของผู้ให้บริการรายเดียว
มีวิธีที่ดีกว่านั้น
แนวคิดหลัก
- เลือกวิธีที่ดีที่สุดสำหรับแต่ละภาษา — ไม่ใช่แค่ค่าเริ่มต้นของผู้ให้บริการ
- ติดตั้งใช้งานด้วยคำสั่งเดียว —
npx champollion syncแปลทุก locale ทุกรูปแบบ ทุกครั้ง - เปลี่ยนวิธีโดยไม่ต้องแก้โค้ด — แค่เปลี่ยน config ไม่ใช่ migration
- ควบคุม pipeline ของคุณเอง — ไม่ผูกติดกับผู้ให้บริการ ไม่มี dashboard รายเดือน ไม่ต้องสร้างบัญชี
{
"version": 3,
"pairs": {
"en:fr": { "method": "deepl" },
"en:ja": { "method": "llm", "model": "google/gemini-2.5-pro" },
"en:de": { "method": "google-translate" },
"en:ko": { "method": "llm", "register": "polite-haeyo" },
"en:crk": { "methodPlugin": "crk-coached-v3" }
}
}
ภาษาฝรั่งเศสใช้ DeepL (ทีมของคุณชอบความคล่องแคล่วในภาษายุโรป) ภาษาญี่ปุ่นใช้ frontier LLM ภาษาเยอรมันใช้ Google Translate (เร็ว ราคาถูก เพียงพอ) ภาษาเกาหลีใช้ LLM ที่มีรูปแบบภาษาทางการ ภาษา Plains Cree ใช้ plugin ที่สร้างโดยชุมชนซึ่งได้คะแนนสูงสุดบน leaderboard
คำสั่งเดิม CI pipeline เดิม วิธีที่ต่างกันในแต่ละคู่ภาษา ไฟล์ config เดียว
เวิร์กโฟลว์ Leaderboard → Deploy
:::tip เร็วๆ นี้: champollion leaderboard CLI
เวิร์กโฟลว์ที่อธิบายด้านล่างคือการผสานรวมที่วางแผนไว้ระหว่าง leaderboard ของ MT Eval Arena และ champollion CLI โครงสร้างพื้นฐานมีอยู่แล้วทั้งสองฝั่ง — ส่วนเชื่อมต่ออยู่ระหว่างการพัฒนา
:::
MT Eval Arena คือสถานที่ที่ใช้ benchmark วิธีการแปลด้วยการให้คะแนนที่ตรวจสอบได้และมี fingerprint ทุกวิธีได้รับคะแนนรวมจากหลายตัวชี้วัด (chrF++, exact match, FST acceptance, semantic scoring) โดย leaderboard จะติดตามทุกการส่งผลงาน
เวิร์กโฟลว์ที่วางแผนไว้:
# Browse the leaderboard from your terminal
npx champollion leaderboard --pair en:crk
# Output:
# ┌──────┬───────────────────────┬────────────┬──────────┬───────────┐
# │ Rank │ Method │ Model │ chrF++ │ Composite │
# ├──────┼───────────────────────┼────────────┼──────────┼───────────┤
# │ 1 │ crk-coached-v3 │ gemini-2.5 │ 43.2 │ 0.67 │
# │ 2 │ fst-gated-pipeline │ gpt-4o │ 41.8 │ 0.63 │
# │ 3 │ prompt-baseline │ claude-4 │ 38.1 │ 0.55 │
# └──────┴───────────────────────┴────────────┴──────────┴───────────┘
# Install the top-scoring method as a plugin
npx champollion plugin install crk-coached-v3
# Use it
npx champollion sync
คุณไม่ต้องสร้างวิธีการเอง ไม่ต้องเทรนโมเดลเอง แค่เลือกตัวที่ดีที่สุดแล้ว deploy หากมีวิธีที่ดีกว่าปรากฏบน leaderboard เดือนหน้า คุณเปลี่ยนได้ด้วยคำสั่งเดียว
สิ่งที่ใช้งานได้ในปัจจุบัน
การเชื่อมต่อระหว่าง leaderboard กับ CLI อยู่ระหว่างการพัฒนา นี่คือสิ่งที่ใช้งานได้ตอนนี้:
วิธีในตัว (ไม่ต้องติดตั้ง plugin เพิ่มเติม)
| วิธี | เหมาะสำหรับ | ค่าใช้จ่าย |
|---|---|---|
llm (ค่าเริ่มต้น) | เน้นคุณภาพ ทุกภาษา | คิดตาม token ผ่าน OpenRouter |
gemini | คุณภาพ + มี free tier | ฟรี (จำกัด) จากนั้นคิดตาม token |
google-translate | ความเร็ว + ปริมาณมาก | $20/ล้านตัวอักษร |
deepl | ภาษายุโรป | $25/ล้านตัวอักษร |
llm-coached | ภาษาที่มีข้อมูล coaching | คิดตาม token ผ่าน OpenRouter |
api | วิธีที่กำหนดเองหรือโฮสต์โดยชุมชน | Self-hosted |
วิธีแบบ plugin (ติดตั้งแยกต่างหาก)
Plugin ที่กำหนดเองสามารถครอบคลุม translation logic ใดก็ได้ — โมเดลที่ fine-tune แล้ว, pipeline ที่ผ่าน FST, community API หรืออะไรก็ตามที่สร้างผลลัพธ์เป็น JSON ดูเพิ่มเติมที่ สร้าง Plugin
เวิร์กโฟลว์สำหรับองค์กร
1. ประเมินคุณภาพปัจจุบันของคุณ
# See what you're getting today
npx champollion status
# Output shows: method per pair, cache hit rate, quality gate stats
2. รัน eval harness กับตัวเลือกที่สนใจ
eval harness ช่วยให้คุณ benchmark หลายวิธีกับชุดข้อมูลเดียวกัน รัน sweep เปรียบเทียบคะแนน แล้วเลือกตัวที่ดีที่สุด:
# In the eval harness repo
python -m mt_eval_harness.run \
--methods coached-v3 baseline prompt-tuned \
--dataset data/your-corpus.json
3. กำหนดค่าตัวที่ดีที่สุดสำหรับแต่ละคู่ภาษา
อัปเดต config เพื่อใช้วิธีที่ดีที่สุดสำหรับแต่ละคู่ภาษา ภาษาที่ต่างกันมีวิธีที่ดีที่สุดต่างกัน — นั่นคือจุดประสงค์หลัก
4. ผสานรวมเข้ากับ CI/CD
# In your CI pipeline
npx champollion lint # Catch hardcoded strings
npx champollion sync # Translate what changed
npx champollion audit # Fail if any locale is incomplete
npx champollion integrity # Validate placeholder consistency
สามคำสั่ง ไม่มีการแปลด้วยตนเอง pipeline จะตรวจจับ string ที่ hardcode แปลด้วยวิธีที่คุณเลือก และทำให้ build ล้มเหลวหากมีสิ่งใดขาดหายหรือเสียหาย
5. การตรวจสอบโดยผู้เชี่ยวชาญ (ไม่บังคับ)
สำหรับเนื้อหาที่มีความสำคัญสูง ให้ export เป็น XLIFF เพื่อให้มนุษย์ตรวจสอบ:
npx champollion xliff export --locale ja --output translations.xliff
# → Send to your translation agency
# → Import corrections back:
npx champollion xliff import translations.xliff
แปลเนื้อหาส่วนใหญ่ด้วยเครื่อง ให้มนุษย์ตรวจสอบเฉพาะส่วนที่สำคัญ จ่ายค่าเวลามนุษย์เฉพาะที่จำเป็นจริงๆ
โมเดลค่าใช้จ่าย
champollion ไม่มีค่าลิขสิทธิ์ ไม่มีค่าสมัครสมาชิกรายเดือน ไม่มีการคิดราคาต่อที่นั่ง เป็นเครื่องมือ CLI แบบ open-source คุณจ่ายเฉพาะค่า API call สำหรับการแปลเท่านั้น:
| ปริมาณ | Google Translate | LLM (Gemini Flash) | LLM (GPT-4o) |
|---|---|---|---|
| 1,000 keys × 5 locales | ~$0.50 | ~$0.30 (free tier) | ~$2.00 |
| 10,000 keys × 15 locales | ~$15 | ~$8 | ~$60 |
| 50,000 keys × 30 locales | ~$75 | ~$40 | ~$300 |
Translation Memory หมายความว่าคุณจ่ายเฉพาะ key ที่เปลี่ยนแปลง ในการ sync ครั้งถัดไป หากคุณอัปเดต 10 string จาก 10,000 คุณจ่ายค่าแปล 10 รายการ ไม่ใช่ 10,000 รายการ
เทียบกับแพลตฟอร์ม TMS
| champollion | Crowdin / Phrase / Locize | |
|---|---|---|
| ราคา | ฟรี (open source) + ค่า API | $50–$500/เดือน + ค่าต่อที่นั่ง |
| การผูกติดกับผู้ให้บริการ | ไม่มี — เปลี่ยน provider ใน config | สูง — ข้อมูลอยู่บน cloud ของพวกเขา |
| การเลือกวิธี | ทุก provider ทุกโมเดล ต่อคู่ภาษา | เฉพาะที่พวกเขามีให้ |
| CI/CD | รองรับเต็มรูปแบบ (lint → sync → audit) | Plugin/webhook |
| วิธีที่กำหนดเอง | ระบบ plugin, community plugin | ไม่รองรับ |
| Quality gate | มีในตัว (wrong-script, echo, length) | แตกต่างกันไป |
| Self-hosted | ได้ (LibreTranslate, custom API) | ไม่ได้ |
ดูการเปรียบเทียบแบบเต็มสำหรับรายละเอียด
อ่านเพิ่มเติม
- เริ่มต้นอย่างรวดเร็ว — รัน sync ครั้งแรกใน 60 วินาที
- วิธีการแปล — รายการวิธีทั้งหมดพร้อม decision tree
- การผสานรวม CI/CD — ทำให้เป็นอัตโนมัติใน pipeline ของคุณ
- การทำงานร่วมกับนักแปลมืออาชีพ — การ export/import XLIFF
- MT Eval Arena — benchmark และ leaderboard
- เอกสารอ้างอิง Configuration — ทุก option ใน config