Curso Robótica Nidia Colorado: Aprendizaje por refuerzo

El aprendizaje por refuerzo.

Es un tipo de aprendizaje que permite que los agentes aprendan a partir de la realimentación que reciben desde el entorno. La idea b´asica est´a inspirada en la propia naturaleza, en la forma en la que personas y animales aprenden (conductivismo). El aprendizaje por refuerzo se basa en probar diferentes cosas y ver qu´e ocurre: • Si las cosas van bien, tendemos a aplicar de nuevo ese comportamiento. • Si las cosas van mal, tendemos a evitarlo. Podemos usar estas ideas para que, por ejemplo, un robot aprenda a crear un controlador para no tener que programarlo.

Básicamente, un controlador de un robot asocia estados con acciones:

Los estados vienen determinados por la informaci´on sensorial que adquiere del entorno.
Las acciones dependen de los actuadores de que disponga el robo
El control une la informaci´on sensorial y las acciones que el robot puede llevar a cabo.
Con el aprendizaje por refuerzo, el robot prueba las diferentes acciones que tiene a su disposici´on en todos los estados en los que se encuentre y va registrando qué ocurre.

Curso Robótica Nidia Colorado

Aprendizaje por refuerzo

No hay comentarios.:

Publicar un comentario

Denunciar abuso