Aprendizaje por refuerzo

 El aprendizaje por refuerzo.

Es un tipo de aprendizaje que permite que los agentes aprendan a partir de la realimentación que reciben desde el entorno. La idea b´asica est´a inspirada en la propia naturaleza, en la forma en la que personas y animales aprenden (conductivismo). El aprendizaje por refuerzo se basa en probar diferentes cosas y ver qu´e ocurre: • Si las cosas van bien, tendemos a aplicar de nuevo ese comportamiento. • Si las cosas van mal, tendemos a evitarlo. Podemos usar estas ideas para que, por ejemplo, un robot aprenda a crear un controlador para no tener que programarlo.


 Básicamente, un controlador de un robot asocia estados con acciones: 

  • Los estados vienen determinados por la informaci´on sensorial que adquiere del entorno. 
  •  Las acciones dependen de los actuadores de que disponga el robo
  •  El control une la informaci´on sensorial y las acciones que el robot puede llevar a cabo. 
  • Con el aprendizaje por refuerzo, el robot prueba las diferentes acciones que tiene a su disposici´on en todos los estados en los que se encuentre y va registrando qué ocurre.
Aprendizaje por refuerzo - Trustnet

No hay comentarios.:

Publicar un comentario