Ir al contenido principal

Idiomas Compatibles

champollion incluye Tarjetas de Idioma — archivos de configuración estructurados para 50 idiomas. Cada tarjeta contiene presets de registro, metadatos del sistema de formalidad, banderas de soporte de métodos, reglas tipográficas e información de escritura. Cualquier idioma que su LLM conozca puede agregarse con una sola línea de configuración — estos son los que tienen registros curados y listos para producción.


Métodos de Traducción

Cada idioma puede usar uno o más de estos métodos de traducción:

IconoMétodoCómo FuncionaCosto
🟢Google TranslateLínea base de MT neuronal. 130+ idiomas. Solo cadenas clave-valor — no puede traducir contenido Markdown de forma segura.~$20/1M caracteres
🔵LLM (OpenRouter)Cualquier idioma que el modelo conozca. Prompts dirigidos por registro. Maneja contenido clave-valor + Markdown.Varía según el modelo
🟣LLM-CoachedLLM + diccionarios gramaticales + datos de coaching inyectados en prompts. Mejor para idiomas morfológicamente complejos.Varía según el modelo
🟠API (Plugin)Canalizaciones de traducción alojadas por la comunidad servidas por HTTP. Compatible con OCAP.Varía según el proveedor

Establezca GOOGLE_TRANSLATE_API_KEY para Google Translate, o OPENROUTER_API_KEY para métodos LLM. Consulte Métodos de Traducción para obtener detalles completos.


Idiomas Prioritarios

Estas son las configuraciones regionales más solicitadas para aplicaciones web y móviles, enumeradas en el orden recomendado de accesibilidad primero de champollion.

BanderaIdiomaCódigoGoogleLLMCoachedEscrituraNotas
🇸🇦ÁrabearRTL. Árabe Estándar Moderno (فصحى).
🇵🇭Filipino (Taglish)tl / filUse fil en configuraciones de Docusaurus. champollion resuelve ambos.
🇫🇷FrancésfrForma vous. Inclusivo de género (Connecté·e).
🇪🇸EspañolesNeutral latinoamericano.
🇩🇪AlemándeForma Sie. Inclusivo de género (Benutzer:innen).
🇯🇵Japonésjaです/ます para texto de cuerpo, する para etiquetas de UI.
🇨🇳Chino (Simplificado)zh简体中文.
🇮🇹ItalianoitForma Lei.
🇧🇷Portugués (BR)ptPortugués brasileño.
🇰🇷CoreanokoRegistro cortés 해요체.

Idiomas Principales del Mundo

BanderaIdiomaCódigoGoogleLLMCoachedEscrituraNotas
🇧🇩BengalíbnPreferencia de শুদ্ধ ভাষা.
🇧🇬Búlgarobg
🇨🇿ChecocsVykání (forma vy).
🇩🇰Danésda
🇬🇷GriegoelΔημοτική moderna.
🇮🇷PersafaRTL.
🇫🇮FinlandésfiSin género gramatical.
🇮🇱HebreoheRTL.
🇮🇳Hindihiशुद्ध हिन्दी. Mínimos préstamos del inglés.
🇭🇺HúngarohuForma Ön.
🇮🇩Indonesioid
🇲🇾Malayoms
🇳🇱HolandésnlForma U.
🇳🇴NoruegonbBokmål.
🇵🇱PolacoplForma Pan/Pani.
🇵🇹Portugués (EU)pt-PTPortugués europeo.
🇷🇴Rumanoro
🇷🇺RusoruForma Вы.
🇸🇰EslovacoskVykanie (forma vy).
🇷🇸Serbiosr🔤 Latín→CirílicoConvertidor de escritura determinista.
🇸🇪Suecosv
🇰🇪Suajilisw
🇹🇭TailandésthPartículas de cortesía ครับ/ค่ะ.
🇹🇷TurcotrForma Siz.
🇺🇦UcranianoukForma Ви.
🇵🇰UrduurRTL. Forma آپ.
🇻🇳Vietnamitavi
🇹🇼Chino (Tradicional)zh-TW繁體中文.
🇬🇪Georgianokaქართული. Familia Kartveliana.
🇳🇬YorubayoÈdè Yorùbá. Tonal (3 tonos).

Variantes Regionales

BanderaIdiomaCódigoGoogleLLMCoachedEscrituraNotas
🇲🇽Español Mexicanoes-MXForma tú. Registro cálido.
🇨🇦Francés Canadiensefr-CAModismos quebequenses.

Idiomas Indígenas y de Recursos Limitados

Estos idiomas no son compatibles con los servicios de MT comerciales. champollion proporciona las herramientas para que las comunidades lingüísticas construyan sus propios métodos bajo principios OCAP.

IdiomaCódigoGoogleLLMCoachedEscrituraEstado
🪶Plains Creecrk🔤 SRO→Silábica🚧 En desarrollo
🌄QuechuaquRunasimi. Sufijos evidenciales.

:::info Plains Cree está en desarrollo activo El registro, infraestructura de coaching, convertidor de escritura y arnés de evaluación para Plains Cree son todos funcionales, pero la canalización de traducción aún no ha sido lanzada. Estamos trabajando con comunidades lingüísticas bajo principios OCAP para garantizar la calidad antes del lanzamiento. Consulte Apoyar un Idioma de Recursos Limitados para la historia completa — y cómo puede contribuir. :::

:::tip Agregar más idiomas de recursos limitados El sistema de plugins de métodos de champollion está diseñado para esto. Una comunidad lingüística puede construir un método de traducción personalizado, alojarlo bajo su propio control, y servirlo a través del método API. El Tablero de Métodos rastrea puntuaciones para cualquier par de idiomas — construya un método, ejecute el arnés, y reclame la puntuación superior. :::


Idiomas Construidos

Los conlangs son compatibles a través de registros LLM y convertidores de escritura opcionales. Utilizan la misma infraestructura que los idiomas reales — la puerta de calidad, el sistema de coaching y la canalización de conversión de escritura funcionan de manera idéntica.

IdiomaCódigoGoogleLLMEscrituraNotas
🖖Klingontlh🔤 Romanización→pIqaDFuente PUA requerida. Vocabulario de Marc Okrand.
🧝Sindarin (Élfico Tolkien)x-elvish-s🔤 Latín→TengwarFuente PUA CSUR requerida.
🏴‍☠️Inglés Piratax-pirateSolo registro. Metáforas náuticas.
🦸Kryptonianox-kryptonian🔤 Latín→KryptonianoFuente PUA requerida.
🎭Inglés Shakespearianox-shakespeareSolo registro. Formas thee/thou, -eth/-est.
🐸Habla de Yodax-yodaSolo registro. Orden de palabras OSV.

Consulte Conlangs, Escrituras y Ortografía para requisitos de fuentes PUA, limitaciones de Unicode y cómo agregar la suya.


Presets de Idioma

El asistente init admite nombres de presets para configuración rápida. Puede mezclar presets con códigos individuales.

PresetSe Expande A
europeanfr, de, es, it, pt, nl
asianja, zh, ko
globalfr, es, de, ja, zh, ko, pt, ar
nordicda, fi, nb, sv
# Mix presets with individual codes
champollion init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja

Agregar Cualquier Idioma

champollion puede traducir a cualquier idioma que su LLM conozca — la tabla anterior solo enumera idiomas con presets de registro integrados. Para agregar un idioma no enumerado, incluya su código BCP-47 en su configuración:

{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}

El LLM traducirá usando su conocimiento de entrenamiento del idioma. Establecer un register le da control sobre el tono, formalidad y convenciones ortográficas. Consulte Configuración para obtener detalles.


Tarjetas de Idioma

Cada idioma integrado tiene una Tarjeta de Idioma — un archivo JSON unificado en shared/language-cards/ que contiene todos los metadatos: registros, formalidad, soporte de métodos, reglas tipográficas, clasificación genealógica, desafíos lingüísticos y recursos de PNL.

Arquitectura de Tarjeta Unificada

Cada tarjeta se carga con entusiasmo en la importación. No hay un nivel de referencia separado — todos los datos viven en un único archivo por idioma. Las tarjetas se enriquecen de fuentes autorizadas:

FuenteDatos
GlottologClasificación de familia, cadena de ancestros, Glottocode
WALSClasificación de género, características tipológicas
CLDREscritura, dirección, reglas plurales, tipografía
ISO 15924Códigos de escritura

Campos Clave de la Tarjeta

CampoQué Contiene
nativeNameEndónimo — el nombre del idioma para sí mismo, en su propia escritura (p. ej., ქართული, Runasimi)
classificationAncla genealógica: familia, género, cadena de ancestros completa de Glottolog
contactInfluencesHistorial de contacto universal — capas de préstamo, superstratos, substratos
Sistema de formalidadDistinción T-V, niveles de habla, keigo, partículas, etc.
Presets de registroPresets de prompts LLM nombrados específicos del carácter del idioma
Soporte de métodoQué APIs de traducción admiten este idioma
Guía de géneroReglas de género gramatical y consejos de escritura inclusiva
Escritura/direcciónCódigo de escritura ISO 15924 y RTL/LTR
ReglasTipografía (comillas, espaciado), capitalización, categorías plurales
glottocodeIdentificador canónico de Glottolog para referencias cruzadas
dataSourcesRastreo de procedencia (p. ej., ["glottolog-5.3", "cldr-48"])

Andamiaje de una Nueva Tarjeta de Idioma

Use el generador para andamiar una tarjeta a partir de fuentes de datos autorizadas (IANA, CLDR, Glottolog):

# Preview what would be generated
node scripts/generate-language-card.mjs sw --dry-run

# Generate a unified card
node scripts/generate-language-card.mjs sw

El generador rellena automáticamente metadatos (códigos, escritura, dirección, plurales, comillas, soporte de métodos, clasificación) y marca campos de juicio lingüístico como TODO para curación humana.

Uso de Claves de Preset

En lugar de escribir texto de registro completo, puede usar un nombre de clave de preset:

{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}

Champollion resuelve la clave al prompt de registro completo. Ejecute npx champollion init para ver presets disponibles para cada idioma.

Presets de Ejemplo

IdiomaPresetsPredeterminado
Francésformal-vous, casual-tuformal-vous
Coreanopolite-haeyo, formal-hapsyo, casual-haepolite-haeyo
Japonéspolite, formal-keigo, casualpolite
Alemánformal-Sie, casual-duformal-Sie
Tailandésneutral-professional, polite-male, polite-femaleneutral-professional
Españolneutral-professional, formal-usted, casual-tuteoneutral-professional

Consulte Contribuir una Tarjeta de Idioma para la especificación completa, incluida validación de campos y lista de verificación de PR.


Véase También