Reinforcement Learning 101

Reinforcement Learning(RL) è uno dei temi di ricerca più caldi nel campo della moderna Intelligenza Artificiale e la sua popolarità sta solo crescendo. Vediamo 5 cose utili da sapere per iniziare con l’RL.

L’apprendimento per rinforzo (RL) è un tipo di tecnica di apprendimento automatico che permette ad un agente di imparare in un ambiente interattivo per tentativi ed errori usando il feedback delle proprie azioni ed esperienze.

Anche se sia l’apprendimento supervisionato che quello di rinforzo usano la mappatura tra input e output, a differenza dell’apprendimento supervisionato dove il feedback fornito all’agente è un insieme corretto di azioni per eseguire un compito, l’apprendimento di rinforzo usa ricompense e punizioni come segnali per comportamenti positivi e negativi.

Rispetto all’apprendimento non supervisionato, l’apprendimento di rinforzo è diverso in termini di obiettivi. Mentre l’obiettivo nell’apprendimento non supervisionato è quello di trovare somiglianze e differenze tra i punti dati, nel caso dell’apprendimento di rinforzo l’obiettivo è quello di trovare un modello di azione adatto che massimizzi la ricompensa cumulativa totale dell’agente. La figura sottostante illustra il ciclo di feedback azione-ricompensa di un generico modello RL.