Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local
Contribuinte(s) |
Melo, Jorge Dantas de 01065547439 http://lattes.cnpq.br/2413250851590746 09463097449 http://lattes.cnpq.br/7325007451912598 Dória Neto, Adrião Duarte 10749896434 http://lattes.cnpq.br/1987295209521433 Aloise, Daniel 03553729406 http://lattes.cnpq.br/5093210888872414 Aloise, Dario José 05763088468 http://lattes.cnpq.br/7266011798625538 Lima Júnior, Francisco Chagas de 75046105420 http://lattes.cnpq.br/9342041276186254 Cavalcanti, George Darmiton da Cunha 93568347415 http://lattes.cnpq.br/8577312109146354 |
---|---|
Data(s) |
27/11/2015
27/11/2015
12/09/2014
|
Resumo |
Técnicas de otimização conhecidas como as metaheurísticas tem conseguido resolversatisfatoriamente problemas conhecidos, mas desenvolvimento das metaheurísticas écaracterizado por escolha de parâmetros para sua execução, na qual a opção apropriadadestes parâmetros (valores). Onde o ajuste de parâmetro é essencial testa-se os parâmetrosaté que resultados viáveis sejam obtidos, normalmente feita pelo desenvolvedor que estaimplementando a metaheuristica. A qualidade dos resultados de uma instância1 de testenão será transferida para outras instâncias a serem testadas e seu feedback pode requererum processo lento de “tentativa e erro” onde o algoritmo têm que ser ajustado para umaaplicação especifica. Diante deste contexto das metaheurísticas surgiu a Busca Reativaque defende a integração entre o aprendizado de máquina dentro de buscas heurísticaspara solucionar problemas de otimização complexos. A partir da integração que a BuscaReativa propõe entre o aprendizado de máquina e as metaheurísticas, surgiu a ideia dese colocar a Aprendizagem por Reforço mais especificamente o algoritmo Q-learning deforma reativa, para selecionar qual busca local é a mais indicada em determinado instanteda busca, para suceder uma outra busca local que não pode mais melhorar a soluçãocorrente na metaheurística VNS. Assim, neste trabalho propomos uma implementação reativa,utilizando aprendizado por reforço para o auto-tuning do algoritmo implementado,aplicado ao problema do caixeiro viajante simétrico e ao problema escalonamento sondaspara manutenção de poços. |
Identificador |
SANTOS, João Paulo Queiroz dos. Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local. 2014. 111f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2014. |
Idioma(s) |
por |
Publicador |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
Direitos |
Acesso Aberto |
Palavras-Chave | #Aprendizagem por reforço #Busca reativa #Otimização combinatória #Busca local #Busca em vizinhança variável #CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
Tipo |
doctoralThesis |