Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local


Autoria(s): Santos, João Paulo Queiroz dos
Contribuinte(s)

Melo, Jorge Dantas de

01065547439

http://lattes.cnpq.br/2413250851590746

09463097449

http://lattes.cnpq.br/7325007451912598

Dória Neto, Adrião Duarte

10749896434

http://lattes.cnpq.br/1987295209521433

Aloise, Daniel

03553729406

http://lattes.cnpq.br/5093210888872414

Aloise, Dario José

05763088468

http://lattes.cnpq.br/7266011798625538

Lima Júnior, Francisco Chagas de

75046105420

http://lattes.cnpq.br/9342041276186254

Cavalcanti, George Darmiton da Cunha

93568347415

http://lattes.cnpq.br/8577312109146354

Data(s)

27/11/2015

27/11/2015

12/09/2014

Resumo

Técnicas de otimização conhecidas como as metaheurísticas tem conseguido resolversatisfatoriamente problemas conhecidos, mas desenvolvimento das metaheurísticas écaracterizado por escolha de parâmetros para sua execução, na qual a opção apropriadadestes parâmetros (valores). Onde o ajuste de parâmetro é essencial testa-se os parâmetrosaté que resultados viáveis sejam obtidos, normalmente feita pelo desenvolvedor que estaimplementando a metaheuristica. A qualidade dos resultados de uma instância1 de testenão será transferida para outras instâncias a serem testadas e seu feedback pode requererum processo lento de “tentativa e erro” onde o algoritmo têm que ser ajustado para umaaplicação especifica. Diante deste contexto das metaheurísticas surgiu a Busca Reativaque defende a integração entre o aprendizado de máquina dentro de buscas heurísticaspara solucionar problemas de otimização complexos. A partir da integração que a BuscaReativa propõe entre o aprendizado de máquina e as metaheurísticas, surgiu a ideia dese colocar a Aprendizagem por Reforço mais especificamente o algoritmo Q-learning deforma reativa, para selecionar qual busca local é a mais indicada em determinado instanteda busca, para suceder uma outra busca local que não pode mais melhorar a soluçãocorrente na metaheurística VNS. Assim, neste trabalho propomos uma implementação reativa,utilizando aprendizado por reforço para o auto-tuning do algoritmo implementado,aplicado ao problema do caixeiro viajante simétrico e ao problema escalonamento sondaspara manutenção de poços.

Identificador

SANTOS, João Paulo Queiroz dos. Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local. 2014. 111f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2014.

http://repositorio.ufrn.br/handle/123456789/19393

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

Brasil

UFRN

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO

Direitos

Acesso Aberto

Palavras-Chave #Aprendizagem por reforço #Busca reativa #Otimização combinatória #Busca local #Busca em vizinhança variável #CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Tipo

doctoralThesis