Vytvorené: 01. 02. 2024 Tlačiť
Ide napríklad o hry, pri ktorých sa väčšinou maximalizuje bodový stav alebo počet výhier.
Posilňované učenie inak:
Posilňované učenie je druh strojového učenia, ktorý sa používa na trénovanie modelov tak, aby sa rozhodovali o správaní v dynamickom (meniacom sa) prostredí s cieľom maximalizovať odmenu.
Podrobne a na príkladoch:
Už na trénovanie modelu nepoužijeme žiadne označené, či neoznačené trénovacie príklady. Učenie tu prebieha tak, že vytvoríme systém – agenta, ktorého nasadíme do prostredia a necháme ho nech sa učí prostredníctvom interakcie s prostredím.
Jediné čo mu musíme určiť, sú pravidlá ako sa môže v danom prostredí správať a tzv. odmeňovaciu funkciu. Pomocou nej vie agent vyhodnotiť, či rozhodnutie, ktoré práve vykonal bolo preňho prospešné alebo nie. Následne metódou pokus-omyl podobne ako človek skúša jednotlivé možnosti a naučí sa ako sa má ideálne správať v jednotlivých situáciách[1].
Modelovým príkladom pre učenie formou odmeňovania je hra šach, kde vytvoríme agenta, definujeme mu povolené ťahy a pravidlo pre výhru. Odmeníme ho, ak vyradí súperovu figúrku alebo vyhrá, potrestáme ho, ak je vyhodená jeho figúrka alebo prehrá. Následne ho necháme, nech si zahrá sám proti sebe niekoľko (miliónov) partií. Výsledkom je umelá inteligencia, ktorú neporazia ani najväčší šachoví veľmajstri.
· Simulácie z fyziky· O Slovensku po slovensky· Slovenské kroje· Kurz národopisu· Diela maliarov· Kontrolné otázky, Domáce úlohy, E-testy - Priemysel· Odborné obrázkové slovníky· Poradňa žiadaného učiteľa· Rýchlokurz Angličtiny. Rozprávky (v mp3)· PREHĽADY (PRIBUDLO, ČO JE NOVÉ?)Seriály:· História sveta (1÷6)· História Slovenska (1÷5)· História módy (1÷5).
Členstvo na portáli
Poznámka pre autora
Copyright © 2013-2024 Wesline, s.r.o. Všetky práva vyhradené. Mapa stránky ako tabuľka | Kurzy | Prehľady |