Veľký jazykový model (Large Language Model, LLM), self supervised, tooltip, transformer architektúra, pre-training, fine-tuning, inference, few-shot learning, emergentné správanie :)

Autor: Igor Krucovčin, Doplnené 27. 11. 2025

Vytvorené: 25. 11. 2025 Tlačiť

Veľký jazykový model v oblasti umelej inteligencie je jazykový model trénovaný na obrovskom množstve textu pomocou špeciálneho strojového učenia bez učiteľa (self-supervised)[1].

Ide o generatívny model, ktorý predikuje nasledujúce slovo alebo vetu na základe kontextu.

Architektúra a technológia

Je založený na transformer architektúre[2]. Využíva mechanizmus self-attention[3] na analýzu kontextu a paralelizáciu výpočtov, čo umožňuje pracovať s dlhými vstupmi efektívnejšie než staršie modely (napríklad RNN).

Obsahuje miliardy až bilióny parametrov, vďaka čomu dokáže pochopiť gramatiku, význam aj jemné jazykové kontexty.

Ako LLM funguje?

1. fáza resp. Predtréning (pre-training) - model sa učí predikovať ďalšie slovo v sekvencii z rozsiahlych textových datasetov (knihy, weby, články...).
2. fáza resp. Doladenie (fine-tuning) - následne sa model môže dolaďovať na konkrétne úlohy. Napríklad na preklad, sumarizáciu, generovanie kódu, otázky a odpovede.
3. fáza resp. Interferencia[4] (inference) - pri použití generuje text, token za tokenom, na základe vstupného promptu, predikujúc pravdepodobne najvhodnejšie pokračovanie.

Schopnosti a aplikácie:

generovanie textu: písanie esejí, článkov, kódu, poézie,
preklad a sumarizácia: automatický preklad jazykov a tvorba skrátených verzií textu,
otázky a odpovede: poskytovanie informatívnych odpovedí na ľudské otázky,
rôzne úlohy: analýza sentimentu [5], tvorba tooltipov[6], právne klauzuly, technická dokumentácia...

Význam a vývoj:

predstavujú prelom v NLP, umožnili vznik chatbotov ako ChatGPT, Gemini, Claude či Copilot, schopných všeobecných textových úloh bez špeciálneho programovania pre každú problematiku,
modely sú schopné few-shot learning[7] či emergentného správania[8] pri dostatočne veľkom trénovacom datasete, tzv. mega dátach a veľkej architektúre,
LLM znamenajú nový štandard v spracovaní prirodzeného jazyka, umožňujúci široké využitie v edukačných, podnikových aj kreatívnych aplikáciách.