الانتقال إلى المحتوى الرئيسي

كيف يعمل champollion

يترجم champollion ملفات اللغات الخاصة بتطبيقك بأمر واحد. إليك ما يحدث خلف الكواليس.

خط المعالجة

عند تشغيل npx champollion sync، ينفّذ champollion خط معالجة من ست مراحل:

قرارات التصميم الأساسية:

  • اكتشاف التغييرات عبر تجزئات SHA-256. يتتبع Champollion كل قيمة مصدرية بتجزئة (hash) في .champollion.lock. عند تحديث نص إنجليزي، تُعاد ترجمة ذلك المفتاح فقط. لهذا السبب يكون sync سريعًا في عمليات التشغيل المتكررة — فهو ينجز الحد الأدنى من العمل.

  • التخزين المؤقت لذاكرة الترجمة. قبل إجراء أي استدعاء لواجهة برمجة التطبيقات (API)، يتحقق champollion من .champollion/tm.json بحثًا عن ترجمات مخزّنة مؤقتًا (مفهرسة حسب النص المصدر + اللغة + الطريقة). في عملية إعادة مزامنة نموذجية بعد تغيير مفتاح واحد، يأتي 142 مفتاحًا من ذاكرة التخزين المؤقت ويصل مفتاح واحد فقط إلى واجهة برمجة التطبيقات.

  • بوابة الجودة قبل الكتابة. تمرّ كل ترجمة بخمسة فحوصات آلية (الفراغ، تكرار المصدر، حلقة الهلوسة، تضخم الطول، التوافق مع نظام الكتابة) قبل أن تصل إلى ملفاتك. تُسجَّل حالات الفشل ولا تُقبل صامتةً أبدًا.

  • سلسلة إعادة المحاولة عند الفشل. إذا فشلت دفعة (خطأ في تحليل JSON، انتهاء مهلة واجهة برمجة التطبيقات)، يعيد champollion المحاولة بدفعات أصغر تدريجيًا: كاملة → نصفية → فردية. هذا يعزل المفتاح الذي يسبب المشكلة دون عرقلة البقية.

طرق الترجمة

يدعم Champollion أربع طرق للترجمة، كل منها مناسبة لسيناريوهات مختلفة:

الطريقةكيف تعملالأنسب لـ
llmموجّه (prompt) منظّم لأي نموذج من OpenRouterاللغات ذات الموارد الوفيرة
llm-coachedالموجّه نفسه + قواعد نحوية ومعجم وملاحظات أسلوبيةاللغات التي ترتكب فيها النماذج اللغوية الكبيرة أخطاء يمكن التنبؤ بها
google-translateطلب دفعي عبر Google Cloud Translation APIاللغات عالية الموارد المدعومة جيدًا من ترجمة Google
apiطلب HTTP POST إلى نقطة النهاية الخاصة بكخطوط المعالجة المخصصة، والنماذج التي يديرها المجتمع

تُضبَط الطرق لكل زوج لغوي على حدة. قد تستخدم google-translate للفرنسية ولكن llm-coached للغة كري السهول (Plains Cree) — يحصل كل زوج على الطريقة الأنسب له.

بيانات التوجيه

بالنسبة لأزواج llm-coached، توفّر بيانات التوجيه للنموذج اللغوي الكبير معرفة لغوية صريحة: قواعد نحوية، ومصطلحات إلزامية، وتفضيلات أسلوبية. تُدرَج هذه البيانات في كل موجّه كسياق منظّم.

coaching/crk.json
{
"grammar_rules": ["Animate nouns take different plural forms than inanimate nouns"],
"dictionary": {"welcome": "ᑕᓂᓯ", "settings": "ᐃᑕᐢᑌᐘᐃᓇ"},
"style_notes": "Use Standard Roman Orthography (SRO) unless explicitly configured otherwise."
}

بيانات التوجيه هي الآلية الأساسية لتحسين جودة الترجمة دون الحاجة إلى ضبط دقيق للنموذج. غيّر القواعد ← أعد تشغيل المزامنة ← لاحظ ما إذا كان ذلك مفيدًا. التكرار فوري.

الإضافات

الإضافات هي وصفات ترجمة مُعدّة مسبقًا لأزواج لغوية محددة. وهي ملفات JSON تعريفية — وليست شيفرة برمجية — تخبر champollion بالطريقة الواجب استخدامها، وبأي إعدادات، وما الجودة التي تم قياسها معياريًا.

champollion plugin install ./crk-coached-v3/
champollion sync # uses the installed plugin for en→crk

تسدّ الإضافات الفجوة بين البحث والإنتاج: فالطريقة التي تحقق نتائج جيدة في MT Eval Arena يمكن تغليفها كإضافة ونشرها هنا.

الصورة الأشمل

champollion هو أحد نصفي منظومة من جزأين:

  • MT Eval Arena — حيث تُطوَّر طرق الترجمة وتُثبَت فعاليتها عبر قياس معياري قابل للتكرار
  • champollion — حيث تُنشَر الطرق المثبتة لترجمة محتوى حقيقي

يربط Eval Harness Bridge بين الاثنين. الطريقة التي تثبت نفسها في Arena تُنشَر هنا. وملاحظات المتحدثين من بيئة الإنتاج تحسّن الإصدار التالي.


تعمّق أكثر