Idiomas Compatibles
champollion incluye Tarjetas de Idioma — archivos de configuración estructurados para 50 idiomas. Cada tarjeta contiene presets de registro, metadatos del sistema de formalidad, banderas de soporte de métodos, reglas tipográficas e información de escritura. Cualquier idioma que su LLM conozca puede agregarse con una sola línea de configuración — estos son los que tienen registros curados y listos para producción.
Métodos de Traducción
Cada idioma puede usar uno o más de estos métodos de traducción:
| Icono | Método | Cómo Funciona | Costo |
|---|---|---|---|
| 🟢 | Google Translate | Línea base de MT neuronal. 130+ idiomas. Solo cadenas clave-valor — no puede traducir contenido Markdown de forma segura. | ~$20/1M caracteres |
| 🔵 | LLM (OpenRouter) | Cualquier idioma que el modelo conozca. Prompts dirigidos por registro. Maneja contenido clave-valor + Markdown. | Varía según el modelo |
| 🟣 | LLM-Coached | LLM + diccionarios gramaticales + datos de coaching inyectados en prompts. Mejor para idiomas morfológicamente complejos. | Varía según el modelo |
| 🟠 | API (Plugin) | Canalizaciones de traducción alojadas por la comunidad servidas por HTTP. Compatible con OCAP. | Varía según el proveedor |
Establezca GOOGLE_TRANSLATE_API_KEY para Google Translate, o OPENROUTER_API_KEY para métodos LLM. Consulte Métodos de Traducción para obtener detalles completos.
Idiomas Prioritarios
Estas son las configuraciones regionales más solicitadas para aplicaciones web y móviles, enumeradas en el orden recomendado de accesibilidad primero de champollion.
| Bandera | Idioma | Código | LLM | Coached | Escritura | Notas | |
|---|---|---|---|---|---|---|---|
| 🇸🇦 | Árabe | ar | ✅ | ✅ | ✅ | — | RTL. Árabe Estándar Moderno (فصحى). |
| 🇵🇭 | Filipino (Taglish) | tl / fil | ✅ | ✅ | ✅ | — | Use fil en configuraciones de Docusaurus. champollion resuelve ambos. |
| 🇫🇷 | Francés | fr | ✅ | ✅ | ✅ | — | Forma vous. Inclusivo de género (Connecté·e). |
| 🇪🇸 | Español | es | ✅ | ✅ | ✅ | — | Neutral latinoamericano. |
| 🇩🇪 | Alemán | de | ✅ | ✅ | ✅ | — | Forma Sie. Inclusivo de género (Benutzer:innen). |
| 🇯🇵 | Japonés | ja | ✅ | ✅ | ✅ | — | です/ます para texto de cuerpo, する para etiquetas de UI. |
| 🇨🇳 | Chino (Simplificado) | zh | ✅ | ✅ | ✅ | — | 简体中文. |
| 🇮🇹 | Italiano | it | ✅ | ✅ | ✅ | — | Forma Lei. |
| 🇧🇷 | Portugués (BR) | pt | ✅ | ✅ | ✅ | — | Portugués brasileño. |
| 🇰🇷 | Coreano | ko | ✅ | ✅ | ✅ | — | Registro cortés 해요체. |
Idiomas Principales del Mundo
| Bandera | Idioma | Código | LLM | Coached | Escritura | Notas | |
|---|---|---|---|---|---|---|---|
| 🇧🇩 | Bengalí | bn | ✅ | ✅ | ✅ | — | Preferencia de শুদ্ধ ভাষা. |
| 🇧🇬 | Búlgaro | bg | ✅ | ✅ | ✅ | — | |
| 🇨🇿 | Checo | cs | ✅ | ✅ | ✅ | — | Vykání (forma vy). |
| 🇩🇰 | Danés | da | ✅ | ✅ | ✅ | — | |
| 🇬🇷 | Griego | el | ✅ | ✅ | ✅ | — | Δημοτική moderna. |
| 🇮🇷 | Persa | fa | ✅ | ✅ | ✅ | — | RTL. |
| 🇫🇮 | Finlandés | fi | ✅ | ✅ | ✅ | — | Sin género gramatical. |
| 🇮🇱 | Hebreo | he | ✅ | ✅ | ✅ | — | RTL. |
| 🇮🇳 | Hindi | hi | ✅ | ✅ | ✅ | — | शुद्ध हिन्दी. Mínimos préstamos del inglés. |
| 🇭🇺 | Húngaro | hu | ✅ | ✅ | ✅ | — | Forma Ön. |
| 🇮🇩 | Indonesio | id | ✅ | ✅ | ✅ | — | |
| 🇲🇾 | Malayo | ms | ✅ | ✅ | ✅ | — | |
| 🇳🇱 | Holandés | nl | ✅ | ✅ | ✅ | — | Forma U. |
| 🇳🇴 | Noruego | nb | ✅ | ✅ | ✅ | — | Bokmål. |
| 🇵🇱 | Polaco | pl | ✅ | ✅ | ✅ | — | Forma Pan/Pani. |
| 🇵🇹 | Portugués (EU) | pt-PT | ✅ | ✅ | ✅ | — | Portugués europeo. |
| 🇷🇴 | Rumano | ro | ✅ | ✅ | ✅ | — | |
| 🇷🇺 | Ruso | ru | ✅ | ✅ | ✅ | — | Forma Вы. |
| 🇸🇰 | Eslovaco | sk | ✅ | ✅ | ✅ | — | Vykanie (forma vy). |
| 🇷🇸 | Serbio | sr | ✅ | ✅ | ✅ | 🔤 Latín→Cirílico | Convertidor de escritura determinista. |
| 🇸🇪 | Sueco | sv | ✅ | ✅ | ✅ | — | |
| 🇰🇪 | Suajili | sw | ✅ | ✅ | ✅ | — | |
| 🇹🇭 | Tailandés | th | ✅ | ✅ | ✅ | — | Partículas de cortesía ครับ/ค่ะ. |
| 🇹🇷 | Turco | tr | ✅ | ✅ | ✅ | — | Forma Siz. |
| 🇺🇦 | Ucraniano | uk | ✅ | ✅ | ✅ | — | Forma Ви. |
| 🇵🇰 | Urdu | ur | ✅ | ✅ | ✅ | — | RTL. Forma آپ. |
| 🇻🇳 | Vietnamita | vi | ✅ | ✅ | ✅ | — | |
| 🇹🇼 | Chino (Tradicional) | zh-TW | ✅ | ✅ | ✅ | — | 繁體中文. |
| 🇬🇪 | Georgiano | ka | ✅ | ✅ | — | — | ქართული. Familia Kartveliana. |
| 🇳🇬 | Yoruba | yo | ✅ | ✅ | — | — | Èdè Yorùbá. Tonal (3 tonos). |
Variantes Regionales
| Bandera | Idioma | Código | LLM | Coached | Escritura | Notas | |
|---|---|---|---|---|---|---|---|
| 🇲🇽 | Español Mexicano | es-MX | ✅ | ✅ | ✅ | — | Forma tú. Registro cálido. |
| 🇨🇦 | Francés Canadiense | fr-CA | ✅ | ✅ | ✅ | — | Modismos quebequenses. |
Idiomas Indígenas y de Recursos Limitados
Estos idiomas no son compatibles con los servicios de MT comerciales. champollion proporciona las herramientas para que las comunidades lingüísticas construyan sus propios métodos bajo principios OCAP.
| Idioma | Código | LLM | Coached | Escritura | Estado | ||
|---|---|---|---|---|---|---|---|
| 🪶 | Plains Cree | crk | ❌ | ✅ | ✅ | 🔤 SRO→Silábica | 🚧 En desarrollo |
| 🌄 | Quechua | qu | ✅ | ✅ | — | — | Runasimi. Sufijos evidenciales. |
:::info Plains Cree está en desarrollo activo El registro, infraestructura de coaching, convertidor de escritura y arnés de evaluación para Plains Cree son todos funcionales, pero la canalización de traducción aún no ha sido lanzada. Estamos trabajando con comunidades lingüísticas bajo principios OCAP para garantizar la calidad antes del lanzamiento. Consulte Apoyar un Idioma de Recursos Limitados para la historia completa — y cómo puede contribuir. :::
:::tip Agregar más idiomas de recursos limitados El sistema de plugins de métodos de champollion está diseñado para esto. Una comunidad lingüística puede construir un método de traducción personalizado, alojarlo bajo su propio control, y servirlo a través del método API. El Tablero de Métodos rastrea puntuaciones para cualquier par de idiomas — construya un método, ejecute el arnés, y reclame la puntuación superior. :::
Idiomas Construidos
Los conlangs son compatibles a través de registros LLM y convertidores de escritura opcionales. Utilizan la misma infraestructura que los idiomas reales — la puerta de calidad, el sistema de coaching y la canalización de conversión de escritura funcionan de manera idéntica.
| Idioma | Código | LLM | Escritura | Notas | ||
|---|---|---|---|---|---|---|
| 🖖 | Klingon | tlh | ❌ | ✅ | 🔤 Romanización→pIqaD | Fuente PUA requerida. Vocabulario de Marc Okrand. |
| 🧝 | Sindarin (Élfico Tolkien) | x-elvish-s | ❌ | ✅ | 🔤 Latín→Tengwar | Fuente PUA CSUR requerida. |
| 🏴☠️ | Inglés Pirata | x-pirate | ❌ | ✅ | — | Solo registro. Metáforas náuticas. |
| 🦸 | Kryptoniano | x-kryptonian | ❌ | ✅ | 🔤 Latín→Kryptoniano | Fuente PUA requerida. |
| 🎭 | Inglés Shakespeariano | x-shakespeare | ❌ | ✅ | — | Solo registro. Formas thee/thou, -eth/-est. |
| 🐸 | Habla de Yoda | x-yoda | ❌ | ✅ | — | Solo registro. Orden de palabras OSV. |
Consulte Conlangs, Escrituras y Ortografía para requisitos de fuentes PUA, limitaciones de Unicode y cómo agregar la suya.
Presets de Idioma
El asistente init admite nombres de presets para configuración rápida. Puede mezclar presets con códigos individuales.
| Preset | Se Expande A |
|---|---|
european | fr, de, es, it, pt, nl |
asian | ja, zh, ko |
global | fr, es, de, ja, zh, ko, pt, ar |
nordic | da, fi, nb, sv |
# Mix presets with individual codes
champollion init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja
Agregar Cualquier Idioma
champollion puede traducir a cualquier idioma que su LLM conozca — la tabla anterior solo enumera idiomas con presets de registro integrados. Para agregar un idioma no enumerado, incluya su código BCP-47 en su configuración:
{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}
El LLM traducirá usando su conocimiento de entrenamiento del idioma. Establecer un register le da control sobre el tono, formalidad y convenciones ortográficas. Consulte Configuración para obtener detalles.
Tarjetas de Idioma
Cada idioma integrado tiene una Tarjeta de Idioma — un archivo JSON unificado en shared/language-cards/ que contiene todos los metadatos: registros, formalidad, soporte de métodos, reglas tipográficas, clasificación genealógica, desafíos lingüísticos y recursos de PNL.
Arquitectura de Tarjeta Unificada
Cada tarjeta se carga con entusiasmo en la importación. No hay un nivel de referencia separado — todos los datos viven en un único archivo por idioma. Las tarjetas se enriquecen de fuentes autorizadas:
| Fuente | Datos |
|---|---|
| Glottolog | Clasificación de familia, cadena de ancestros, Glottocode |
| WALS | Clasificación de género, características tipológicas |
| CLDR | Escritura, dirección, reglas plurales, tipografía |
| ISO 15924 | Códigos de escritura |
Campos Clave de la Tarjeta
| Campo | Qué Contiene |
|---|---|
nativeName | Endónimo — el nombre del idioma para sí mismo, en su propia escritura (p. ej., ქართული, Runasimi) |
classification | Ancla genealógica: familia, género, cadena de ancestros completa de Glottolog |
contactInfluences | Historial de contacto universal — capas de préstamo, superstratos, substratos |
| Sistema de formalidad | Distinción T-V, niveles de habla, keigo, partículas, etc. |
| Presets de registro | Presets de prompts LLM nombrados específicos del carácter del idioma |
| Soporte de método | Qué APIs de traducción admiten este idioma |
| Guía de género | Reglas de género gramatical y consejos de escritura inclusiva |
| Escritura/dirección | Código de escritura ISO 15924 y RTL/LTR |
| Reglas | Tipografía (comillas, espaciado), capitalización, categorías plurales |
glottocode | Identificador canónico de Glottolog para referencias cruzadas |
dataSources | Rastreo de procedencia (p. ej., ["glottolog-5.3", "cldr-48"]) |
Andamiaje de una Nueva Tarjeta de Idioma
Use el generador para andamiar una tarjeta a partir de fuentes de datos autorizadas (IANA, CLDR, Glottolog):
# Preview what would be generated
node scripts/generate-language-card.mjs sw --dry-run
# Generate a unified card
node scripts/generate-language-card.mjs sw
El generador rellena automáticamente metadatos (códigos, escritura, dirección, plurales, comillas, soporte de métodos, clasificación) y marca campos de juicio lingüístico como TODO para curación humana.
Uso de Claves de Preset
En lugar de escribir texto de registro completo, puede usar un nombre de clave de preset:
{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}
Champollion resuelve la clave al prompt de registro completo. Ejecute npx champollion init para ver presets disponibles para cada idioma.
Presets de Ejemplo
| Idioma | Presets | Predeterminado |
|---|---|---|
| Francés | formal-vous, casual-tu | formal-vous |
| Coreano | polite-haeyo, formal-hapsyo, casual-hae | polite-haeyo |
| Japonés | polite, formal-keigo, casual | polite |
| Alemán | formal-Sie, casual-du | formal-Sie |
| Tailandés | neutral-professional, polite-male, polite-female | neutral-professional |
| Español | neutral-professional, formal-usted, casual-tuteo | neutral-professional |
Consulte Contribuir una Tarjeta de Idioma para la especificación completa, incluida validación de campos y lista de verificación de PR.
Véase También
- Configuración — referencia de configuración completa incluyendo configuración de idioma
- Métodos de Traducción — cómo funciona cada método
- Convertidores de Escritura — canalización de conversión de escritura determinista
- Conlangs, Escrituras y Ortografía — fuentes PUA, Unicode, agregar conlangs
- Apoyar un Idioma de Recursos Limitados — construir métodos para idiomas desatendidos