اللغات المدعومة
يأتي champollion مزوّدًا بـ بطاقات اللغات (Language Cards) — وهي ملفات إعداد منظّمة لـ 50 لغة. تحتوي كل بطاقة على إعدادات مسبقة للأسلوب اللغوي، وبيانات وصفية لنظام الرسمية، ومؤشرات دعم الطرق، وقواعد الطباعة، ومعلومات نظام الكتابة. يمكن إضافة أي لغة يعرفها نموذج LLM الخاص بك بسطر إعداد واحد — أما اللغات المذكورة هنا فهي التي تتوفر لها أساليب لغوية منسّقة وجاهزة للاستخدام الإنتاجي.
طرق الترجمة
يمكن لكل لغة استخدام طريقة أو أكثر من طرق الترجمة التالية:
| الأيقونة | الطريقة | آلية العمل | التكلفة |
|---|---|---|---|
| 🟢 | Google Translate | ترجمة آلية عصبية أساسية. أكثر من 130 لغة. سلاسل المفتاح-القيمة فقط — لا يمكنها ترجمة محتوى Markdown بأمان. | ~20 دولارًا لكل مليون حرف |
| 🔵 | LLM (OpenRouter) | أي لغة يعرفها النموذج. تعليمات موجَّهة بحسب الأسلوب اللغوي. تتعامل مع محتوى المفتاح-القيمة ومحتوى Markdown. | تختلف حسب النموذج |
| 🟣 | LLM-Coached | نموذج LLM + قواميس نحوية + بيانات تدريبية تُدرَج في التعليمات. الأفضل للغات ذات البنية الصرفية المعقدة. | تختلف حسب النموذج |
| 🟠 | API (Plugin) | خطوط ترجمة يستضيفها المجتمع وتُقدَّم عبر HTTP. متوافقة مع OCAP. | تختلف حسب المزوّد |
عيّن GOOGLE_TRANSLATE_API_KEY لاستخدام Google Translate، أو OPENROUTER_API_KEY لطرق LLM. راجع طرق الترجمة للحصول على التفاصيل الكاملة.
اللغات ذات الأولوية
هذه هي اللغات الأكثر طلبًا لتطبيقات الويب والهواتف المحمولة، مرتّبة وفق ترتيب champollion الموصى به الذي يضع إمكانية الوصول أولًا.
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇸🇦 | العربية | ar | ✅ | ✅ | ✅ | — | من اليمين إلى اليسار (RTL). العربية الفصحى الحديثة (فصحى). |
| 🇵🇭 | الفلبينية (Taglish) | tl / fil | ✅ | ✅ | ✅ | — | استخدم fil في إعدادات Docusaurus. يتعرّف champollion على كلا الرمزين. |
| 🇫🇷 | الفرنسية | fr | ✅ | ✅ | ✅ | — | صيغة Vous. شاملة للجنسين (Connecté·e). |
| 🇪🇸 | الإسبانية | es | ✅ | ✅ | ✅ | — | إسبانية أمريكا اللاتينية المحايدة. |
| 🇩🇪 | الألمانية | de | ✅ | ✅ | ✅ | — | صيغة Sie. شاملة للجنسين (Benutzer:innen). |
| 🇯🇵 | اليابانية | ja | ✅ | ✅ | ✅ | — | です/ます للنصوص الأساسية، وする لتسميات واجهة المستخدم. |
| 🇨🇳 | الصينية (المبسطة) | zh | ✅ | ✅ | ✅ | — | 简体中文. |
| 🇮🇹 | الإيطالية | it | ✅ | ✅ | ✅ | — | صيغة Lei. |
| 🇧🇷 | البرتغالية (البرازيل) | pt | ✅ | ✅ | ✅ | — | البرتغالية البرازيلية. |
| 🇰🇷 | الكورية | ko | ✅ | ✅ | ✅ | — | أسلوب 해요체 المهذّب. |
اللغات العالمية الرئيسية
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇧🇩 | البنغالية | bn | ✅ | ✅ | ✅ | — | تفضيل শুদ্ধ ভাষা. |
| 🇧🇬 | البلغارية | bg | ✅ | ✅ | ✅ | — | |
| 🇨🇿 | التشيكية | cs | ✅ | ✅ | ✅ | — | Vykání (صيغة vy). |
| 🇩🇰 | الدنماركية | da | ✅ | ✅ | ✅ | — | |
| 🇬🇷 | اليونانية | el | ✅ | ✅ | ✅ | — | اليونانية الحديثة Δημοτική. |
| 🇮🇷 | الفارسية | fa | ✅ | ✅ | ✅ | — | من اليمين إلى اليسار (RTL). |
| 🇫🇮 | الفنلندية | fi | ✅ | ✅ | ✅ | — | لا تحتوي على جنس نحوي. |
| 🇮🇱 | العبرية | he | ✅ | ✅ | ✅ | — | من اليمين إلى اليسار (RTL). |
| 🇮🇳 | الهندية | hi | ✅ | ✅ | ✅ | — | शुद्ध हिन्दी. حد أدنى من الكلمات الإنجليزية الدخيلة. |
| 🇭🇺 | المجرية | hu | ✅ | ✅ | ✅ | — | صيغة Ön. |
| 🇮🇩 | الإندونيسية | id | ✅ | ✅ | ✅ | — | |
| 🇲🇾 | الملايو | ms | ✅ | ✅ | ✅ | — | |
| 🇳🇱 | الهولندية | nl | ✅ | ✅ | ✅ | — | صيغة U. |
| 🇳🇴 | النرويجية | nb | ✅ | ✅ | ✅ | — | Bokmål. |
| 🇵🇱 | البولندية | pl | ✅ | ✅ | ✅ | — | صيغة Pan/Pani. |
| 🇵🇹 | البرتغالية (أوروبا) | pt-PT | ✅ | ✅ | ✅ | — | البرتغالية الأوروبية. |
| 🇷🇴 | الرومانية | ro | ✅ | ✅ | ✅ | — | |
| 🇷🇺 | الروسية | ru | ✅ | ✅ | ✅ | — | صيغة Вы. |
| 🇸🇰 | السلوفاكية | sk | ✅ | ✅ | ✅ | — | Vykanie (صيغة vy). |
| 🇷🇸 | الصربية | sr | ✅ | ✅ | ✅ | 🔤 لاتيني←سيريلي | محوّل نظام كتابة حتمي. |
| 🇸🇪 | السويدية | sv | ✅ | ✅ | ✅ | — | |
| 🇰🇪 | السواحلية | sw | ✅ | ✅ | ✅ | — | |
| 🇹🇭 | التايلاندية | th | ✅ | ✅ | ✅ | — | أدوات التهذيب ครับ/ค่ะ. |
| 🇹🇷 | التركية | tr | ✅ | ✅ | ✅ | — | صيغة Siz. |
| 🇺🇦 | الأوكرانية | uk | ✅ | ✅ | ✅ | — | صيغة Ви. |
| 🇵🇰 | الأردية | ur | ✅ | ✅ | ✅ | — | من اليمين إلى اليسار (RTL). صيغة آپ. |
| 🇻🇳 | الفيتنامية | vi | ✅ | ✅ | ✅ | — | |
| 🇹🇼 | الصينية (التقليدية) | zh-TW | ✅ | ✅ | ✅ | — | 繁體中文. |
| 🇬🇪 | الجورجية | ka | ✅ | ✅ | — | — | ქართული. من عائلة اللغات الكارتفيلية. |
| 🇳🇬 | اليوروبا | yo | ✅ | ✅ | — | — | Èdè Yorùbá. لغة نغمية (3 نغمات). |
المتغيّرات الإقليمية
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇲🇽 | الإسبانية المكسيكية | es-MX | ✅ | ✅ | ✅ | — | صيغة Tú. أسلوب ودّي. |
| 🇨🇦 | الفرنسية الكندية | fr-CA | ✅ | ✅ | ✅ | — | تعابير كيبيكية. |
لغات الشعوب الأصلية واللغات منخفضة الموارد
هذه اللغات غير مدعومة من خدمات الترجمة الآلية التجارية. يوفّر champollion الأدوات اللازمة للمجتمعات اللغوية لبناء طرقها الخاصة وفق مبادئ OCAP.
| اللغة | الرمز | LLM | Coached | نظام الكتابة | الحالة | ||
|---|---|---|---|---|---|---|---|
| 🪶 | كري السهول (Plains Cree) | crk | ❌ | ✅ | ✅ | 🔤 SRO←المقاطع الصوتية | 🚧 قيد التطوير |
| 🌄 | الكيتشوا | qu | ✅ | ✅ | — | — | Runasimi. لواحق إثباتية. |
:::info لغة كري السهول قيد التطوير النشط الأسلوب اللغوي والبنية التحتية للتدريب ومحوّل نظام الكتابة وأداة التقييم الخاصة بلغة كري السهول كلها تعمل، لكن خط الترجمة لم يُطرح بعد. نحن نعمل مع المجتمعات اللغوية وفق مبادئ OCAP لضمان الجودة قبل الإطلاق. راجع دعم لغة منخفضة الموارد للاطلاع على القصة الكاملة — وكيف يمكنك المساهمة. :::
:::tip إضافة المزيد من اللغات منخفضة الموارد صُمّم نظام إضافات الطرق في champollion لهذا الغرض. يمكن لأي مجتمع لغوي بناء طريقة ترجمة مخصّصة، واستضافتها تحت سيطرته الكاملة، وتقديمها عبر طريقة API. تتتبّع لوحة ترتيب الطرق النتائج لأي زوج لغوي — ابنِ طريقة، وشغّل أداة التقييم، واحصل على المركز الأول. :::
اللغات المصطنعة
اللغات المصطنعة (Conlangs) مدعومة عبر أساليب LLM اللغوية ومحوّلات أنظمة الكتابة الاختيارية. وهي تستخدم البنية التحتية ذاتها المستخدمة للغات الحقيقية — إذ تعمل بوابة الجودة ونظام التدريب وخط تحويل نظام الكتابة بالطريقة نفسها تمامًا.
| اللغة | الرمز | LLM | نظام الكتابة | ملاحظات | ||
|---|---|---|---|---|---|---|
| 🖖 | الكلينغونية | tlh | ❌ | ✅ | 🔤 الكتابة اللاتينية←pIqaD | يتطلب خط PUA. مفردات Marc Okrand. |
| 🧝 | السندارينية (لغة الإلف عند Tolkien) | x-elvish-s | ❌ | ✅ | 🔤 لاتيني←Tengwar | يتطلب خط CSUR PUA. |
| 🏴☠️ | إنجليزية القراصنة | x-pirate | ❌ | ✅ | — | أسلوب لغوي فقط. استعارات بحرية. |
| 🦸 | الكريبتونية | x-kryptonian | ❌ | ✅ | 🔤 لاتيني←كريبتوني | يتطلب خط PUA. |
| 🎭 | الإنجليزية الشكسبيرية | x-shakespeare | ❌ | ✅ | — | أسلوب لغوي فقط. صيغ Thee/thou وeth-/est-. |
| 🐸 | لغة يودا | x-yoda | ❌ | ✅ | — | أسلوب لغوي فقط. ترتيب الجملة OSV. |
راجع اللغات المصطنعة وأنظمة الكتابة والإملاء لمعرفة متطلبات خطوط PUA، وقيود Unicode، وكيفية إضافة لغتك الخاصة.
الإعدادات المسبقة للغات
يدعم معالج init أسماء الإعدادات المسبقة للإعداد السريع. يمكنك المزج بين الإعدادات المسبقة والرموز الفردية.
| الإعداد المسبق | يتوسّع إلى |
|---|---|
european | fr, de, es, it, pt, nl |
asian | ja, zh, ko |
global | fr, es, de, ja, zh, ko, pt, ar |
nordic | da, fi, nb, sv |
# Mix presets with individual codes
champollion init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja
إضافة أي لغة
يمكن لـ champollion الترجمة إلى أي لغة يعرفها نموذج LLM الخاص بك — الجدول أعلاه يسرد فقط اللغات التي تتوفر لها إعدادات أسلوب لغوي مدمجة. لإضافة لغة غير مدرجة، أدرج رمز BCP-47 الخاص بها في ملف الإعداد:
{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}
سيترجم نموذج LLM باستخدام معرفته التدريبية باللغة. ويمنحك تعيين register التحكم في النبرة والرسمية والأعراف الإملائية. راجع الإعداد للحصول على التفاصيل.
بطاقات اللغات
لكل لغة مدمجة بطاقة لغة (Language Card) — ملف JSON موحّد في shared/language-cards/ يحتوي على جميع البيانات الوصفية: الأساليب اللغوية، والرسمية، ودعم الطرق، وقواعد الطباعة، والتصنيف الجينالوجي، والتحديات اللغوية، وموارد معالجة اللغات الطبيعية (NLP).
بنية البطاقة الموحّدة
تُحمَّل كل بطاقة فورًا عند الاستيراد. لا يوجد مستوى مرجعي منفصل — جميع البيانات موجودة في ملف واحد لكل لغة. وتُثرى البطاقات من مصادر موثوقة:
| المصدر | البيانات |
|---|---|
| Glottolog | تصنيف العائلة اللغوية، وسلسلة الأصول، ورمز Glottocode |
| WALS | تصنيف الجنس اللغوي، والسمات النمطية |
| CLDR | نظام الكتابة، والاتجاه، وقواعد الجمع، والطباعة |
| ISO 15924 | رموز أنظمة الكتابة |
حقول البطاقة الرئيسية
| الحقل | المحتوى |
|---|---|
nativeName | الاسم الذاتي — اسم اللغة لنفسها بنظام كتابتها الخاص (مثل ქართული، Runasimi) |
classification | المرجع الجينالوجي: العائلة، والجنس، وسلسلة الأصول الكاملة من Glottolog |
contactInfluences | تاريخ الاحتكاك اللغوي الشامل — طبقات الاقتراض، واللغات العليا، واللغات السفلى |
| نظام الرسمية | تمييز T-V، ومستويات الخطاب، والـ keigo، والأدوات اللغوية، وما إلى ذلك |
| الإعدادات المسبقة للأسلوب اللغوي | إعدادات تعليمات LLM مسبقة مسمّاة خاصة بطابع اللغة |
| دعم الطرق | واجهات الترجمة البرمجية التي تدعم هذه اللغة |
| إرشادات الجنس اللغوي | قواعد الجنس النحوي ونصائح الكتابة الشاملة |
| نظام الكتابة/الاتجاه | رمز نظام الكتابة وفق ISO 15924 والاتجاه RTL/LTR |
| القواعد | الطباعة (علامات الاقتباس، والمسافات)، والأحرف الكبيرة، وفئات الجمع |
glottocode | معرّف Glottolog القياسي للإحالة المرجعية |
dataSources | تتبّع المصدر (مثل ["glottolog-5.3", "cldr-48"]) |
إنشاء بطاقة لغة جديدة
استخدم المولّد لإنشاء بطاقة من مصادر البيانات الموثوقة (IANA وCLDR وGlottolog):
# Preview what would be generated
node scripts/generate-language-card.mjs sw --dry-run
# Generate a unified card
node scripts/generate-language-card.mjs sw
يملأ المولّد البيانات الوصفية تلقائيًا (الرموز، ونظام الكتابة، والاتجاه، وقواعد الجمع، وعلامات الاقتباس، ودعم الطرق، والتصنيف) ويضع علامة TODO على حقول الحكم اللغوي ليتولّى البشر تنسيقها.
استخدام مفاتيح الإعدادات المسبقة
بدلًا من كتابة نص الأسلوب اللغوي بالكامل، يمكنك استخدام اسم مفتاح إعداد مسبق:
{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}
يحوّل Champollion المفتاح إلى نص الأسلوب اللغوي الكامل. شغّل npx champollion init لعرض الإعدادات المسبقة المتاحة لكل لغة.
أمثلة على الإعدادات المسبقة
| اللغة | الإعدادات المسبقة | الافتراضي |
|---|---|---|
| الفرنسية | formal-vous, casual-tu | formal-vous |
| الكورية | polite-haeyo, formal-hapsyo, casual-hae | polite-haeyo |
| اليابانية | polite, formal-keigo, casual | polite |
| الألمانية | formal-Sie, casual-du | formal-Sie |
| التايلاندية | neutral-professional, polite-male, polite-female | neutral-professional |
| الإسبانية | neutral-professional, formal-usted, casual-tuteo | neutral-professional |
راجع المساهمة ببطاقة لغة للاطلاع على المواصفات الكاملة، بما في ذلك التحقق من الحقول وقائمة التحقق لطلبات السحب (PR).
انظر أيضًا
- الإعداد — مرجع الإعدادات الكامل بما في ذلك إعداد اللغات
- طرق الترجمة — آلية عمل كل طريقة
- محوّلات أنظمة الكتابة — خط تحويل أنظمة الكتابة الحتمي
- اللغات المصطنعة وأنظمة الكتابة والإملاء — خطوط PUA، وUnicode، وإضافة اللغات المصطنعة
- دعم لغة منخفضة الموارد — بناء طرق للغات قليلة الدعم