Biblioteca Digital

Aprendizaje por refuerzo en espacios de estados continuos.

**Autoria(s):** Fernández Rebollo, Fernando
Contribuinte(s)	Borrajo Millán, Daniel Universidad Carlos III de Madrid. Departamento de Informática;
Data(s)	16/05/2013 16/05/2013 2002 22/01/2009
Resumo	El aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes de forma automática. La mayor parte de la teoría del aprendizaje por refuerzo se fundamenta en la programación dinámica. La implementación tradicional de estas funciones en forma tabular no es práctica cuando el espacio de estados es muy grande, o infinito. En este caso es necesario aplicar métodos de generalización que permitan extrapolar la experiencia adquirida para un conjunto limitado de estados, a la totalidad del espacio.. Para resolver el problema mencionado se puede recurrir a dos aproximaciones. Por un lado, existen técnicas basadas en una selección adecuada de puntos significativos y, por otro, se pueden emplear los métodos basados en el desarrollo de funciones de valor con algún método supervisado de aproximación de funciones. El trabajo trata de desarrollar métodos de aprendizaje por refuerzo aplicables en dominios con espacios de estados continuos, partiendo de las dos aproximaciones mencionadas, para fundirlas en un método eficaz que permita que el aprendizaje totalmente automático.. Esta investigación facilita un nuevo método de aprendizaje por refuerzo para dominios con espacios de estados continuos (ENNC-QL). Este método permite aprender tareas en entornos de varias dimensiones con mayor eficacia y el número de parámetros que debe suministrársele es mínimo.
Identificador	p. 181-189 http://e-archivo.uc3m.es/bitstream/10016/569/8/Fernandez%20Rebollo%2c%20Fernando%281%29.pdf http://hdl.handle.net/11162/42490 http://e-archivo.uc3m.es/bitstream/10016/569/7/Fernandez%20Rebollo%2c%20Fernando%282%29.pdf MD L/TU 00157
Idioma(s)	spa
Direitos	Cuando no se especifique otra condición, los documentos incorporados a Redined a texto completo, se hallan bajo las condiciones de uso de sólo lectura y únicamente podrán ser citados con reconocimiento del autor(es). Para cualquier otro uso, deberá solicitarse el permiso del autor (es)
Palavras-Chave	#enseñanza a distancia #inteligencia artificial #uso didáctico del ordenador #método de enseñanza #enseñanza automatizada
Tipo	Tesis doctoral

Acesso ao item digital