Redigerer Forsterkende læring (avsnitt)

==Bruk==
Forsterkende læring gir agenten et mål å oppnå. Agenten lærer så hvordan man skal oppnå dette målet ved prøving og feiling gjennom vekselvirkninger med omgivelsene. Forsterkende læring er godt egnet for logiske spill, siden de tradisjonelt er definert som en sekvens av handlinger. Spill som [[poker]], [[backgammon]], [[Othello (brettspill)|othello]] og [[sjakk]] er blitt håndtert på en mer eller mindre vellykket måte. Et problem innafor forsterkende læring er definert av tre grunnleggende deler: omgivelsene (eller miljøet), den forsterkende funksjonen og verdifunksjonen.