Aprendizaje por refuerzo en espacios de estados continuos.


Autoria(s): Fernández Rebollo, Fernando
Contribuinte(s)

Borrajo Millán, Daniel

Universidad Carlos III de Madrid. Departamento de Informática;

Data(s)

16/05/2013

16/05/2013

2002

22/01/2009

Resumo

El aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes de forma automática. La mayor parte de la teoría del aprendizaje por refuerzo se fundamenta en la programación dinámica. La implementación tradicional de estas funciones en forma tabular no es práctica cuando el espacio de estados es muy grande, o infinito. En este caso es necesario aplicar métodos de generalización que permitan extrapolar la experiencia adquirida para un conjunto limitado de estados, a la totalidad del espacio.. Para resolver el problema mencionado se puede recurrir a dos aproximaciones. Por un lado, existen técnicas basadas en una selección adecuada de puntos significativos y, por otro, se pueden emplear los métodos basados en el desarrollo de funciones de valor con algún método supervisado de aproximación de funciones. El trabajo trata de desarrollar métodos de aprendizaje por refuerzo aplicables en dominios con espacios de estados continuos, partiendo de las dos aproximaciones mencionadas, para fundirlas en un método eficaz que permita que el aprendizaje totalmente automático.. Esta investigación facilita un nuevo método de aprendizaje por refuerzo para dominios con espacios de estados continuos (ENNC-QL). Este método permite aprender tareas en entornos de varias dimensiones con mayor eficacia y el número de parámetros que debe suministrársele es mínimo.

Identificador

p. 181-189

http://e-archivo.uc3m.es/bitstream/10016/569/8/Fernandez%20Rebollo%2c%20Fernando%281%29.pdf

http://hdl.handle.net/11162/42490

http://e-archivo.uc3m.es/bitstream/10016/569/7/Fernandez%20Rebollo%2c%20Fernando%282%29.pdf

MD L/TU 00157

Idioma(s)

spa

Direitos

Cuando no se especifique otra condición, los documentos incorporados a Redined a texto completo, se hallan bajo las condiciones de uso de sólo lectura y únicamente podrán ser citados con reconocimiento del autor(es). Para cualquier otro uso, deberá solicitarse el permiso del autor (es)

Palavras-Chave #enseñanza a distancia #inteligencia artificial #uso didáctico del ordenador #método de enseñanza #enseñanza automatizada
Tipo

Tesis doctoral