1 resultado para Simple methods
em Massachusetts Institute of Technology
Filtro por publicador
- Repository Napier (1)
- Academic Archive On-line (Stockholm University; Sweden) (2)
- Acceda, el repositorio institucional de la Universidad de Las Palmas de Gran Canaria. España (2)
- AMS Tesi di Dottorato - Alm@DL - Università di Bologna (7)
- AMS Tesi di Laurea - Alm@DL - Università di Bologna (4)
- ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha (4)
- Archivo Digital para la Docencia y la Investigación - Repositorio Institucional de la Universidad del País Vasco (1)
- Aston University Research Archive (17)
- Biblioteca de Teses e Dissertações da USP (1)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (10)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (188)
- Bioline International (3)
- BORIS: Bern Open Repository and Information System - Berna - Suiça (18)
- CentAUR: Central Archive University of Reading - UK (26)
- CiencIPCA - Instituto Politécnico do Cávado e do Ave, Portugal (6)
- Cochin University of Science & Technology (CUSAT), India (3)
- Coffee Science - Universidade Federal de Lavras (1)
- Collection Of Biostatistics Research Archive (2)
- Comissão Econômica para a América Latina e o Caribe (CEPAL) (1)
- Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (15)
- CORA - Cork Open Research Archive - University College Cork - Ireland (1)
- Dalarna University College Electronic Archive (1)
- Digital Commons at Florida International University (2)
- Digital Peer Publishing (1)
- DigitalCommons@The Texas Medical Center (3)
- DigitalCommons@University of Nebraska - Lincoln (1)
- Diposit Digital de la UB - Universidade de Barcelona (2)
- Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (8)
- Duke University (1)
- FUNDAJ - Fundação Joaquim Nabuco (1)
- Hospital Prof. Dr. Fernando Fonseca - Portugal (1)
- Instituto Politécnico do Porto, Portugal (80)
- Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (5)
- Massachusetts Institute of Technology (1)
- National Center for Biotechnology Information - NCBI (1)
- Nottingham eTheses (1)
- Publishing Network for Geoscientific & Environmental Data (2)
- QSpace: Queen's University - Canada (1)
- QUB Research Portal - Research Directory and Institutional Repository for Queen's University Belfast (1)
- ReCiL - Repositório Científico Lusófona - Grupo Lusófona, Portugal (1)
- Repositório Científico da Universidade de Évora - Portugal (1)
- Repositório Científico do Instituto Politécnico de Lisboa - Portugal (37)
- Repositório da Produção Científica e Intelectual da Unicamp (22)
- Repositório da Universidade Federal do Espírito Santo (UFES), Brazil (2)
- Repositório do Centro Hospitalar de Lisboa Central, EPE - Centro Hospitalar de Lisboa Central, EPE, Portugal (8)
- Repositório Institucional da Universidade de Aveiro - Portugal (1)
- Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (39)
- RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (59)
- SAPIENTIA - Universidade do Algarve - Portugal (2)
- Scielo España (1)
- Scielo Saúde Pública - SP (92)
- Scientific Open-access Literature Archive and Repository (2)
- Universidad de Alicante (4)
- Universidad del Rosario, Colombia (1)
- Universidad Politécnica de Madrid (12)
- Universidade Complutense de Madrid (1)
- Universidade do Minho (36)
- Universidade dos Açores - Portugal (5)
- Universidade Estadual Paulista "Júlio de Mesquita Filho" (UNESP) (1)
- Universidade Federal do Pará (1)
- Universita di Parma (1)
- Universitat de Girona, Spain (3)
- Universitätsbibliothek Kassel, Universität Kassel, Germany (2)
- Université de Lausanne, Switzerland (26)
- Université de Montréal (1)
- Université de Montréal, Canada (6)
- University of Michigan (7)
- University of Queensland eSpace - Australia (176)
- WestminsterResearch - UK (1)
Resumo:
There has been recent interest in using temporal difference learning methods to attack problems of prediction and control. While these algorithms have been brought to bear on many problems, they remain poorly understood. It is the purpose of this thesis to further explore these algorithms, presenting a framework for viewing them and raising a number of practical issues and exploring those issues in the context of several case studies. This includes applying the TD(lambda) algorithm to: 1) learning to play tic-tac-toe from the outcome of self-play and of play against a perfectly-playing opponent and 2) learning simple one-dimensional segmentation tasks.