ข้ามไปยังเนื้อหาหลัก

champollion สำหรับองค์กร

ทีมของคุณแปลเนื้อหาเป็นประจำ คุณมีไฟล์ locale สะสมอยู่ มี CI pipeline และกระบวนการที่อาจเกี่ยวข้องกับการที่ใครบางคนรัน Google Translate ด้วยตนเอง คัดลอกผลลัพธ์ลงใน JSON แล้วก็หวังว่าทุกอย่างจะเรียบร้อย หรือไม่ก็คุณกำลังจ่ายเงินให้แพลตฟอร์ม TMS ที่ผูกติดคุณไว้กับ translation engine ของผู้ให้บริการรายเดียว

มีวิธีที่ดีกว่านั้น

แนวคิดหลัก

  1. เลือกวิธีที่ดีที่สุดสำหรับแต่ละภาษา — ไม่ใช่แค่ค่าเริ่มต้นของผู้ให้บริการ
  2. ติดตั้งใช้งานด้วยคำสั่งเดียวnpx champollion sync แปลทุก locale ทุกรูปแบบ ทุกครั้ง
  3. เปลี่ยนวิธีโดยไม่ต้องแก้โค้ด — แค่เปลี่ยน config ไม่ใช่ migration
  4. ควบคุม pipeline ของคุณเอง — ไม่ผูกติดกับผู้ให้บริการ ไม่มี dashboard รายเดือน ไม่ต้องสร้างบัญชี
champollion.config.json
{
"version": 3,
"pairs": {
"en:fr": { "method": "deepl" },
"en:ja": { "method": "llm", "model": "google/gemini-2.5-pro" },
"en:de": { "method": "google-translate" },
"en:ko": { "method": "llm", "register": "polite-haeyo" },
"en:crk": { "methodPlugin": "crk-coached-v3" }
}
}

ภาษาฝรั่งเศสใช้ DeepL (ทีมของคุณชอบความคล่องแคล่วในภาษายุโรป) ภาษาญี่ปุ่นใช้ frontier LLM ภาษาเยอรมันใช้ Google Translate (เร็ว ราคาถูก เพียงพอ) ภาษาเกาหลีใช้ LLM ที่มีรูปแบบภาษาทางการ ภาษา Plains Cree ใช้ plugin ที่สร้างโดยชุมชนซึ่งได้คะแนนสูงสุดบน leaderboard

คำสั่งเดิม CI pipeline เดิม วิธีที่ต่างกันในแต่ละคู่ภาษา ไฟล์ config เดียว

เวิร์กโฟลว์ Leaderboard → Deploy

:::tip เร็วๆ นี้: champollion leaderboard CLI เวิร์กโฟลว์ที่อธิบายด้านล่างคือการผสานรวมที่วางแผนไว้ระหว่าง leaderboard ของ MT Eval Arena และ champollion CLI โครงสร้างพื้นฐานมีอยู่แล้วทั้งสองฝั่ง — ส่วนเชื่อมต่ออยู่ระหว่างการพัฒนา :::

MT Eval Arena คือสถานที่ที่ใช้ benchmark วิธีการแปลด้วยการให้คะแนนที่ตรวจสอบได้และมี fingerprint ทุกวิธีได้รับคะแนนรวมจากหลายตัวชี้วัด (chrF++, exact match, FST acceptance, semantic scoring) โดย leaderboard จะติดตามทุกการส่งผลงาน

เวิร์กโฟลว์ที่วางแผนไว้:

# Browse the leaderboard from your terminal
npx champollion leaderboard --pair en:crk

# Output:
# ┌──────┬───────────────────────┬────────────┬──────────┬───────────┐
# │ Rank │ Method │ Model │ chrF++ │ Composite │
# ├──────┼───────────────────────┼────────────┼──────────┼───────────┤
# │ 1 │ crk-coached-v3 │ gemini-2.5 │ 43.2 │ 0.67 │
# │ 2 │ fst-gated-pipeline │ gpt-4o │ 41.8 │ 0.63 │
# │ 3 │ prompt-baseline │ claude-4 │ 38.1 │ 0.55 │
# └──────┴───────────────────────┴────────────┴──────────┴───────────┘

# Install the top-scoring method as a plugin
npx champollion plugin install crk-coached-v3

# Use it
npx champollion sync

คุณไม่ต้องสร้างวิธีการเอง ไม่ต้องเทรนโมเดลเอง แค่เลือกตัวที่ดีที่สุดแล้ว deploy หากมีวิธีที่ดีกว่าปรากฏบน leaderboard เดือนหน้า คุณเปลี่ยนได้ด้วยคำสั่งเดียว

สิ่งที่ใช้งานได้ในปัจจุบัน

การเชื่อมต่อระหว่าง leaderboard กับ CLI อยู่ระหว่างการพัฒนา นี่คือสิ่งที่ใช้งานได้ตอนนี้:

วิธีในตัว (ไม่ต้องติดตั้ง plugin เพิ่มเติม)

วิธีเหมาะสำหรับค่าใช้จ่าย
llm (ค่าเริ่มต้น)เน้นคุณภาพ ทุกภาษาคิดตาม token ผ่าน OpenRouter
geminiคุณภาพ + มี free tierฟรี (จำกัด) จากนั้นคิดตาม token
google-translateความเร็ว + ปริมาณมาก$20/ล้านตัวอักษร
deeplภาษายุโรป$25/ล้านตัวอักษร
llm-coachedภาษาที่มีข้อมูล coachingคิดตาม token ผ่าน OpenRouter
apiวิธีที่กำหนดเองหรือโฮสต์โดยชุมชนSelf-hosted

วิธีแบบ plugin (ติดตั้งแยกต่างหาก)

Plugin ที่กำหนดเองสามารถครอบคลุม translation logic ใดก็ได้ — โมเดลที่ fine-tune แล้ว, pipeline ที่ผ่าน FST, community API หรืออะไรก็ตามที่สร้างผลลัพธ์เป็น JSON ดูเพิ่มเติมที่ สร้าง Plugin

เวิร์กโฟลว์สำหรับองค์กร

1. ประเมินคุณภาพปัจจุบันของคุณ

# See what you're getting today
npx champollion status

# Output shows: method per pair, cache hit rate, quality gate stats

2. รัน eval harness กับตัวเลือกที่สนใจ

eval harness ช่วยให้คุณ benchmark หลายวิธีกับชุดข้อมูลเดียวกัน รัน sweep เปรียบเทียบคะแนน แล้วเลือกตัวที่ดีที่สุด:

# In the eval harness repo
python -m mt_eval_harness.run \
--methods coached-v3 baseline prompt-tuned \
--dataset data/your-corpus.json

3. กำหนดค่าตัวที่ดีที่สุดสำหรับแต่ละคู่ภาษา

อัปเดต config เพื่อใช้วิธีที่ดีที่สุดสำหรับแต่ละคู่ภาษา ภาษาที่ต่างกันมีวิธีที่ดีที่สุดต่างกัน — นั่นคือจุดประสงค์หลัก

4. ผสานรวมเข้ากับ CI/CD

# In your CI pipeline
npx champollion lint # Catch hardcoded strings
npx champollion sync # Translate what changed
npx champollion audit # Fail if any locale is incomplete
npx champollion integrity # Validate placeholder consistency

สามคำสั่ง ไม่มีการแปลด้วยตนเอง pipeline จะตรวจจับ string ที่ hardcode แปลด้วยวิธีที่คุณเลือก และทำให้ build ล้มเหลวหากมีสิ่งใดขาดหายหรือเสียหาย

5. การตรวจสอบโดยผู้เชี่ยวชาญ (ไม่บังคับ)

สำหรับเนื้อหาที่มีความสำคัญสูง ให้ export เป็น XLIFF เพื่อให้มนุษย์ตรวจสอบ:

npx champollion xliff export --locale ja --output translations.xliff
# → Send to your translation agency
# → Import corrections back:
npx champollion xliff import translations.xliff

แปลเนื้อหาส่วนใหญ่ด้วยเครื่อง ให้มนุษย์ตรวจสอบเฉพาะส่วนที่สำคัญ จ่ายค่าเวลามนุษย์เฉพาะที่จำเป็นจริงๆ

โมเดลค่าใช้จ่าย

champollion ไม่มีค่าลิขสิทธิ์ ไม่มีค่าสมัครสมาชิกรายเดือน ไม่มีการคิดราคาต่อที่นั่ง เป็นเครื่องมือ CLI แบบ open-source คุณจ่ายเฉพาะค่า API call สำหรับการแปลเท่านั้น:

ปริมาณGoogle TranslateLLM (Gemini Flash)LLM (GPT-4o)
1,000 keys × 5 locales~$0.50~$0.30 (free tier)~$2.00
10,000 keys × 15 locales~$15~$8~$60
50,000 keys × 30 locales~$75~$40~$300

Translation Memory หมายความว่าคุณจ่ายเฉพาะ key ที่เปลี่ยนแปลง ในการ sync ครั้งถัดไป หากคุณอัปเดต 10 string จาก 10,000 คุณจ่ายค่าแปล 10 รายการ ไม่ใช่ 10,000 รายการ

เทียบกับแพลตฟอร์ม TMS

champollionCrowdin / Phrase / Locize
ราคาฟรี (open source) + ค่า API$50–$500/เดือน + ค่าต่อที่นั่ง
การผูกติดกับผู้ให้บริการไม่มี — เปลี่ยน provider ใน configสูง — ข้อมูลอยู่บน cloud ของพวกเขา
การเลือกวิธีทุก provider ทุกโมเดล ต่อคู่ภาษาเฉพาะที่พวกเขามีให้
CI/CDรองรับเต็มรูปแบบ (lint → sync → audit)Plugin/webhook
วิธีที่กำหนดเองระบบ plugin, community pluginไม่รองรับ
Quality gateมีในตัว (wrong-script, echo, length)แตกต่างกันไป
Self-hostedได้ (LibreTranslate, custom API)ไม่ได้

ดูการเปรียบเทียบแบบเต็มสำหรับรายละเอียด

อ่านเพิ่มเติม