Aceleração da classificação de documentos com recurso a GPU


Autoria(s): Severino, Pedro Nuno Pereira
Contribuinte(s)

Medeiros, Pedro

Data(s)

17/01/2013

17/01/2013

2012

Resumo

Dissertação para obtenção do Grau de Mestre em Engenharia Informática

O objectivo desta dissertação é explorar formas de diminuir o tempo gasto na extracção de características relevantes( features) de textos disponíveis na Internet. Esta diminuição é obtida paralelizando parte dos algoritmos usados; as versões paralelizadas são vocacionadas para a execução em GPUs. São concebidas, implementadas e testadas versões paralelas da fase da determinação da relevância de features num sujeito/ objecto a ser analisado. Nesta parte do trabalho a principal contribuição é uma implementação do algoritmo de extracção de features adaptado a GPUs com ênfase nas rotinas de manipulação de grafos. Em objectos mais complexos a implementação atingiu tempos de execução 16 vezes inferiores à implementação sequencial em CPU. Foi também desenvolvido um servidor concorrente que reside no GPU e que oferece um conjunto de serviços relacionados com o processamento das features mais relevantes. Esse servidor faz uma gestão integrada dos recursos de computação existentes no GPU. A avaliação deste servidor foi feita sujeitando-o a diferentes misturas de sujeitos e com um ritmo de chegada de pedidos crescente. Considerando o critériomais relevante o número de pedidos cujo processamento excede um tempo limite, a solução baseada no servidor GPU começa a exceder esse tempo quando o ritmo de chegada de sujeitos ultrapassa os 70 pedidos/s, enquanto que na versão multi CPU isso acontece quando o ritmo atinge perto de 30 pedidos/s. Neste âmbito foi desenvolvida uma infra-estrutura que pode ser reaproveitada sempre que seja conveniente usar o GPU no paradigma do processamento de pedidos em lote. Esta tese foi desenvolvida num contexto empresarial, e do trabalho realizado resultam contributos para o melhoramento dos produtos da empresa, bem como da viabilidade técnica e económica do uso de GPUs em diversos contextos relevantes para a empresa. Neste contexto a versão definitiva da tese omite alguma informação.

Identificador

http://hdl.handle.net/10362/8546

Idioma(s)

por

Publicador

Faculdade de Ciências e Tecnologia

Direitos

openAccess

Palavras-Chave #OpenCL #Computação paralela #GPU #Classificação de documentos
Tipo

masterThesis