1 resultado para Opponent colors
em Massachusetts Institute of Technology
Filtro por publicador
- AMS Tesi di Dottorato - Alm@DL - Università di Bologna (4)
- AMS Tesi di Laurea - Alm@DL - Università di Bologna (1)
- Andina Digital - Repositorio UASB-Digital - Universidade Andina Simón Bolívar (1)
- ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha (7)
- Avian Conservation and Ecology - Eletronic Cientific Hournal - Écologie et conservation des oiseaux: (1)
- Biblioteca Digital | Sistema Integrado de Documentación | UNCuyo - UNCUYO. UNIVERSIDAD NACIONAL DE CUYO. (4)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (20)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (30)
- Biblioteca Digital de la Universidad Católica Argentina (1)
- Biodiversity Heritage Library, United States (1)
- BORIS: Bern Open Repository and Information System - Berna - Suiça (31)
- Brock University, Canada (6)
- Bucknell University Digital Commons - Pensilvania - USA (5)
- CentAUR: Central Archive University of Reading - UK (7)
- Cochin University of Science & Technology (CUSAT), India (1)
- Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (35)
- Dalarna University College Electronic Archive (13)
- Digital Archives@Colby (2)
- Digital Commons - Montana Tech (1)
- Digital Commons at Florida International University (1)
- Digital Repository at Iowa State University (1)
- DigitalCommons@The Texas Medical Center (1)
- Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (9)
- Gallica, Bibliotheque Numerique - Bibliothèque nationale de France (French National Library) (BnF), France (1)
- Harvard University (329)
- Instituto Politécnico do Porto, Portugal (6)
- Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (2)
- Massachusetts Institute of Technology (1)
- Memoria Académica - FaHCE, UNLP - Argentina (15)
- Ministerio de Cultura, Spain (18)
- National Center for Biotechnology Information - NCBI (12)
- Publishing Network for Geoscientific & Environmental Data (4)
- QUB Research Portal - Research Directory and Institutional Repository for Queen's University Belfast (3)
- Repositório Científico do Instituto Politécnico de Lisboa - Portugal (6)
- Repositório da Escola Nacional de Administração Pública (ENAP) (1)
- Repositório da Produção Científica e Intelectual da Unicamp (6)
- Repositório digital da Fundação Getúlio Vargas - FGV (3)
- Repositório do Centro Hospitalar de Lisboa Central, EPE - Centro Hospitalar de Lisboa Central, EPE, Portugal (1)
- Repositorio Institucional da UFLA (RIUFLA) (2)
- Repositório Institucional da Universidade de Brasília (1)
- Repositório Institucional da Universidade Estadual de São Paulo - UNESP (1)
- Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (162)
- RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (10)
- Scielo Saúde Pública - SP (40)
- Universidad de Alicante (10)
- Universidad del Rosario, Colombia (3)
- Universidad Politécnica de Madrid (16)
- Universidade do Minho (10)
- Universidade dos Açores - Portugal (1)
- Universidade Federal do Pará (8)
- Universidade Federal do Rio Grande do Norte (UFRN) (25)
- Universidade Metodista de São Paulo (2)
- Universitat de Girona, Spain (7)
- Universitätsbibliothek Kassel, Universität Kassel, Germany (1)
- Université de Lausanne, Switzerland (19)
- Université de Montréal, Canada (18)
- University of Michigan (29)
- University of Queensland eSpace - Australia (13)
Resumo:
There has been recent interest in using temporal difference learning methods to attack problems of prediction and control. While these algorithms have been brought to bear on many problems, they remain poorly understood. It is the purpose of this thesis to further explore these algorithms, presenting a framework for viewing them and raising a number of practical issues and exploring those issues in the context of several case studies. This includes applying the TD(lambda) algorithm to: 1) learning to play tic-tac-toe from the outcome of self-play and of play against a perfectly-playing opponent and 2) learning simple one-dimensional segmentation tasks.