Biblioteca Digital

1 resultado para Practical professional

em Massachusetts Institute of Technology

Filtro por publicador

Abertay Research Collections - Abertay University’s repository (1)
Academic Archive On-line (Jönköping University; Sweden) (1)
Aston University Research Archive (3)
Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (16)
Biblioteca Virtual del Sistema Sanitario Público de Andalucía (BV-SSPA), Junta de Andalucía. Consejería de Salud y Bienestar Social, Spain (5)
Biodiversity Heritage Library, United States (22)
BORIS: Bern Open Repository and Information System - Berna - Suiça (2)
Brock University, Canada (32)
CentAUR: Central Archive University of Reading - UK (2)
CiencIPCA - Instituto Politécnico do Cávado e do Ave, Portugal (4)
Cochin University of Science & Technology (CUSAT), India (9)
Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (108)
Cor-Ciencia - Acuerdo de Bibliotecas Universitarias de Córdoba (ABUC), Argentina (1)
CORA - Cork Open Research Archive - University College Cork - Ireland (1)
Digital Commons at Florida International University (1)
Digital Peer Publishing (1)
DigitalCommons@The Texas Medical Center (1)
Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (66)
Fachlicher Dokumentenserver Paedagogik/Erziehungswissenschaften (1)
Gallica, Bibliotheque Numerique - Bibliothèque nationale de France (French National Library) (BnF), France (1)
Institute of Public Health in Ireland, Ireland (26)
Instituto Politécnico de Santarém (1)
Instituto Politécnico do Porto, Portugal (46)
Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (23)
Martin Luther Universitat Halle Wittenberg, Germany (2)
Massachusetts Institute of Technology (1)
Memoria Académica - FaHCE, UNLP - Argentina (3)
Ministerio de Cultura, Spain (156)
ReCiL - Repositório Científico Lusófona - Grupo Lusófona, Portugal (1)
Repositório Científico da Universidade de Évora - Portugal (1)
Repositório Científico do Instituto Politécnico de Lisboa - Portugal (24)
Repositório da Escola Nacional de Administração Pública (ENAP) (1)
Repositório da Produção Científica e Intelectual da Unicamp (23)
Repositório de Administração Pública (REPAP) - Direção-Geral da Qualificação dos Trabalhadores em Funções Públicas (INA), Portugal (1)
Repositório do Centro Hospitalar de Lisboa Central, EPE - Centro Hospitalar de Lisboa Central, EPE, Portugal (2)
Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (3)
RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (22)
School of Medicine, Washington University, United States (1)
Scielo Saúde Pública - SP (36)
Scottish Institute for Research in Economics (SIRE) (SIRE), United Kingdom (1)
Universidad Autónoma de Nuevo León, Mexico (11)
Universidad de Alicante (2)
Universidad del Rosario, Colombia (13)
Universidad Politécnica de Madrid (2)
Universidade do Minho (20)
Universidade Técnica de Lisboa (1)
Universitat de Girona, Spain (8)
Universitätsbibliothek Kassel, Universität Kassel, Germany (7)
Université de Lausanne, Switzerland (105)
Université de Montréal, Canada (35)
University of Canberra Research Repository - Australia (1)
University of Michigan (6)
University of Queensland eSpace - Australia (67)
University of Southampton, United Kingdom (44)
University of Washington (1)

Explorations of the Practical Issues of Learning Prediction-Control Tasks Using Temporal Difference Learning Methods

Relevância:

20.00% 20.00%

Publicador:

Resumo:

There has been recent interest in using temporal difference learning methods to attack problems of prediction and control. While these algorithms have been brought to bear on many problems, they remain poorly understood. It is the purpose of this thesis to further explore these algorithms, presenting a framework for viewing them and raising a number of practical issues and exploring those issues in the context of several case studies. This includes applying the TD(lambda) algorithm to: 1) learning to play tic-tac-toe from the outcome of self-play and of play against a perfectly-playing opponent and 2) learning simple one-dimensional segmentation tasks.

Veja mais