Paano Gumagana ang champollion

Isinasalin ng champollion ang mga locale file ng inyong app sa pamamagitan ng isang command. Narito ang nangyayari sa likod ng proseso.

Ang Pipeline

Kapag pinatakbo ninyo ang npx champollion sync, isinasagawa ng champollion ang isang anim-na-yugtong pipeline:

Mahahalagang desisyon sa disenyo:

Pagtukoy ng pagbabago sa pamamagitan ng mga SHA-256 hash. Sinusubaybayan ng Champollion ang bawat source value gamit ang isang hash sa .champollion.lock. Kapag nag-update kayo ng isang English string, ang key lamang na iyon ang muling isasalin. Ito ang dahilan kung bakit mabilis ang sync sa mga paulit-ulit na run — minimal lamang ang ginagawa nito.
Translation Memory caching. Bago gumawa ng anumang API call, sinusuri ng champollion ang .champollion/tm.json para sa mga naka-cache na salin (naka-key ayon sa source text + locale + method). Sa karaniwang re-sync matapos baguhin ang isang key, 142 key ang nanggagaling sa cache at 1 key ang tumatama sa API.
Quality gate bago magsulat. Dumaraan ang bawat salin sa limang automated na pagsusuri (walang laman, source echo, hallucination loop, length inflation, script compliance) bago nito galawin ang inyong mga file. Nila-log ang mga failure, at hindi kailanman tahimik na tinatanggap.
Retry cascade kapag may failure. Kapag nabigo ang isang batch (JSON parse error, API timeout), muling susubukan ng champollion gamit ang paunti-unting mas maliliit na batch: buo → kalahati → indibidwal. Inihihiwalay nito ang may problemang key nang hindi hinaharangan ang iba pa.

Mga Paraan ng Pagsasalin

Sinusuportahan ng Champollion ang apat na paraan ng pagsasalin, na bawat isa ay angkop sa iba’t ibang sitwasyon:

Paraan	Paano ito gumagana	Pinakamainam para sa
`llm`	Structured prompt sa anumang OpenRouter model	Mga wikang may sapat na mapagkukunan
`llm-coached`	Parehong prompt + mga tuntuning panggramatika, dictionary, at style notes	Mga wikang karaniwang nagkakamali ang mga LLM sa mahuhulaang paraan
`google-translate`	Google Cloud Translation API batch request	Mga wikang high-resource na may mahusay na suporta sa GT
`api`	HTTP POST sa sarili ninyong endpoint	Mga custom pipeline, mga model na kontrolado ng komunidad

Iko-configure ang mga method per language pair. Maaari ninyong gamitin ang google-translate para sa French ngunit llm-coached para sa Plains Cree — bawat pair ay nakakakuha ng method na pinakamainam para rito.

Coaching Data

Para sa mga llm-coached pair, ang coaching data ay nagbibigay sa LLM ng tahasang kaalamang lingguwistiko: mga tuntuning panggramatika, itinakdang terminolohiya, at mga kagustuhan sa estilo. Iniinject ito sa bawat prompt bilang structured context.

coaching/crk.json
{
  "grammar_rules": ["Animate nouns take different plural forms than inanimate nouns"],
  "dictionary": {"welcome": "ᑕᓂᓯ", "settings": "ᐃᑕᐢᑌᐘᐃᓇ"},
  "style_notes": "Use Standard Roman Orthography (SRO) unless explicitly configured otherwise."
}

Ang coaching data ang pangunahing mekanismo para mapahusay ang kalidad ng pagsasalin nang hindi nagfi-fine-tune ng model. Baguhin ang mga rule → patakbuhin muli ang sync → tingnan kung nakatulong ito. Agad ang pag-iterate.

Mga Plugin

Ang mga plugin ay mga pre-packaged na recipe ng pagsasalin para sa partikular na mga language pair. Mga JSON manifest ang mga ito — hindi code — na nagsasabi sa champollion kung aling method ang gagamitin, kasama ang mga setting nito, at kung anong kalidad ang na-benchmark.

champollion plugin install ./crk-coached-v3/
champollion sync   # uses the installed plugin for en→crk

Tinutulay ng mga plugin ang agwat sa pagitan ng pananaliksik at production: ang isang method na may mataas na score sa MT Eval Arena ay maaaring i-package bilang plugin at i-deploy dito.

Ang Mas Malaking Larawan

Ang champollion ay kalahati ng isang dalawang-bahaging ecosystem:

MT Eval Arena — kung saan ang mga method ng pagsasalin ay dinidevelop at pinatutunayan gamit ang reproducible benchmarking
champollion — kung saan ang mga napatunayang method ay dinideploy upang magsalin ng totoong content

Pinagdurugtong ng Eval Harness Bridge ang dalawa. Ang method na nagpapatunay ng sarili nito sa Arena ay nade-deploy dito. Pinapahusay ng feedback mula sa mga tagapagsalita sa production ang susunod na bersyon.

Mas Malalim na Pag-aaral

Paano Gumagana ang Sync — detalyadong step-by-step na walkthrough ng pipeline
Quality Gate — ang limang automated na pagsusuri
Translation Memory — caching at pagtitipid sa gastos
Mga Paraan ng Pagsasalin — detalyadong paghahambing ng mga method
Arkitektura — pangkalahatang-ideya ng disenyo ng system

Ang Pipeline​

Mga Paraan ng Pagsasalin​

Coaching Data​

Mga Plugin​

Ang Mas Malaking Larawan​

Mas Malalim na Pag-aaral​