in computer science, reinforcement learning is a sub-area of machine learning concerned with how an agent ought to take actions in an environment so as to maximize some notion of long-term reward.
wikipedia
stavo notando una cosa. quando per un esperimento neurologico si addestrano scimmie per eseguire qualche compito, la procedura é piú o meno sempre la stessa. si mette la scimmia in un ambiente in cui probabilmente eseguirá il compito, e se lo fa, allora le si dá un po di succo d'arancia. lei, la scimmia intendo, dopo un po' capirá che ogni volta che esegue il suo compito, ottiene del succo d'arancia, e comincerá, furbescamente, ad imparare ad eseguire il compito desiderato alla perfezione. ora, se siamo stati in grado di capire come addestrare le scimmie (e faccio notare che possiamo in questo modo addestrarle a compiere attivitá che noi stessi potremmo non essere in grado di compiere, é sufficiente che sappiamo giudicare i risultati), perché esiste ancora il concetto di "vis modica"? sono forse i bambini piú cretini delle scimmie?
Iscriviti a:
Commenti sul post (Atom)
Nessun commento:
Posta un commento