Biblioteca Digital

1 resultado para practical

em Massachusetts Institute of Technology

Filtro por publicador

JISC Information Environment Repository (1)
Repository Napier (1)
Aberdeen University (1)
Aberystwyth University Repository - Reino Unido (1)
Academic Research Repository at Institute of Developing Economies (2)
Acceda, el repositorio institucional de la Universidad de Las Palmas de Gran Canaria. España (5)
AMS Tesi di Dottorato - Alm@DL - Università di Bologna (2)
Applied Math and Science Education Repository - Washington - USA (1)
Aquatic Commons (10)
Archive of European Integration (45)
Archivo Digital para la Docencia y la Investigación - Repositorio Institucional de la Universidad del País Vasco (3)
Avian Conservation and Ecology - Eletronic Cientific Hournal - Écologie et conservation des oiseaux: (1)
Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (5)
Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (5)
Biblioteca Digital de la Universidad Católica Argentina (1)
Biodiversity Heritage Library, United States (6)
BORIS: Bern Open Repository and Information System - Berna - Suiça (60)
Boston University Digital Common (6)
Brock University, Canada (5)
Bucknell University Digital Commons - Pensilvania - USA (1)
CaltechTHESIS (2)
Cambridge University Engineering Department Publications Database (87)
CentAUR: Central Archive University of Reading - UK (67)
Chinese Academy of Sciences Institutional Repositories Grid Portal (14)
Coffee Science - Universidade Federal de Lavras (1)
Collection Of Biostatistics Research Archive (1)
Comissão Econômica para a América Latina e o Caribe (CEPAL) (12)
CORA - Cork Open Research Archive - University College Cork - Ireland (4)
CUNY Academic Works (2)
Dalarna University College Electronic Archive (1)
Department of Computer Science E-Repository - King's College London, Strand, London (12)
Digital Howard @ Howard University | Howard University Research (1)
Digital Knowledge Repository of Central Drug Research Institute (1)
Digital Peer Publishing (2)
DigitalCommons@The Texas Medical Center (1)
Digitale Sammlungen - Goethe-Universität Frankfurt am Main (2)
Duke University (2)
eResearch Archive - Queensland Department of Agriculture; Fisheries and Forestry (1)
Greenwich Academic Literature Archive - UK (2)
Harvard University (3)
Helda - Digital Repository of University of Helsinki (5)
Indian Institute of Science - Bangalore - Índia (17)
Instituto Politécnico de Santarém (1)
Instituto Politécnico do Porto, Portugal (5)
Massachusetts Institute of Technology (1)
Ministerio de Cultura, Spain (37)
National Center for Biotechnology Information - NCBI (2)
Plymouth Marine Science Electronic Archive (PlyMSEA) (9)
QUB Research Portal - Research Directory and Institutional Repository for Queen's University Belfast (82)
Queensland University of Technology - ePrints Archive (133)
Repositório Científico do Instituto Politécnico de Lisboa - Portugal (1)
Repositório digital da Fundação Getúlio Vargas - FGV (1)
Repositório do Centro Hospitalar de Lisboa Central, EPE - Centro Hospitalar de Lisboa Central, EPE, Portugal (1)
Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (26)
RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (2)
SAPIENTIA - Universidade do Algarve - Portugal (1)
Universidad Autónoma de Nuevo León, Mexico (11)
Universidad de Alicante (11)
Universidad del Rosario, Colombia (2)
Universidad Politécnica de Madrid (28)
Universitat de Girona, Spain (3)
Universitätsbibliothek Kassel, Universität Kassel, Germany (1)
Université de Lausanne, Switzerland (6)
Université de Montréal, Canada (5)
University of Connecticut - USA (1)
University of Michigan (110)
University of Southampton, United Kingdom (7)
WestminsterResearch - UK (4)
Worcester Research and Publications - Worcester Research and Publications - UK (3)

Explorations of the Practical Issues of Learning Prediction-Control Tasks Using Temporal Difference Learning Methods

Relevância:

20.00% 20.00%

Publicador:

Resumo:

There has been recent interest in using temporal difference learning methods to attack problems of prediction and control. While these algorithms have been brought to bear on many problems, they remain poorly understood. It is the purpose of this thesis to further explore these algorithms, presenting a framework for viewing them and raising a number of practical issues and exploring those issues in the context of several case studies. This includes applying the TD(lambda) algorithm to: 1) learning to play tic-tac-toe from the outcome of self-play and of play against a perfectly-playing opponent and 2) learning simple one-dimensional segmentation tasks.

Veja mais