El aprendizaje por refuerzo.
Es un tipo de aprendizaje que permite que los agentes aprendan a partir de la realimentación que reciben desde el entorno. La idea b´asica est´a inspirada en la propia naturaleza, en la forma en la que personas y animales aprenden (conductivismo). El aprendizaje por refuerzo se basa en probar diferentes cosas y ver qu´e ocurre: • Si las cosas van bien, tendemos a aplicar de nuevo ese comportamiento. • Si las cosas van mal, tendemos a evitarlo. Podemos usar estas ideas para que, por ejemplo, un robot aprenda a crear un controlador para no tener que programarlo.
Básicamente, un controlador de un robot asocia estados con acciones:
- Los estados vienen determinados por la informaci´on sensorial que adquiere del entorno.
- Las acciones dependen de los actuadores de que disponga el robo
- El control une la informaci´on sensorial y las acciones que el robot puede llevar a cabo.
- Con el aprendizaje por refuerzo, el robot prueba las diferentes acciones que tiene a su disposici´on en todos los estados en los que se encuentre y va registrando qué ocurre.
No hay comentarios.:
Publicar un comentario