Implementación eficiente de redes neuronales autoorganizadas en CUDA C/C++.


Autoria(s): Gill, Shelley
Contribuinte(s)

Lenguajes y Ciencias de la Computación

Domínguez Merino, Enrique

Data(s)

01/06/2016

01/06/2016

01/12/2015

01/06/2016

Resumo

En este documento se expondrá una implementación del problema del viajante de comercio usando una implementación personalizada de un mapa auto-organizado basándose en soluciones anteriores y adaptándolas a la arquitectura CUDA, haciendo a la vez una comparativa de la implementación eficiente en CUDA C/C++ con la implementación de las funciones de GPU incluidas en el Parallel Computing Toolbox de Matlab. La solución que se da reduce en casi un cuarto las iteraciones necesarias para llegar a una solución buena del problema mencionado, además de la mejora inminente del uso de las arquitecturas paralelas. En esta solución se estudia la mejora en tiempo que se consigue con el uso específico de la memoria compartida, siendo esta una de las herramientas más potentes para mejorar el rendimiento. En lo referente a los tiempos de ejecución, se llega a concluir que la mejor solución es el lanzamiento de un kernel de CUDA desde Matlab a través de la funcionalidad incluida en el Parallel Computing Toolbox.

Identificador

http://hdl.handle.net/10630/11541

Idioma(s)

spa

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #Grado en Ingeniería Informática - Trabajos Fin de Grado #Redes neuronales artificiales - Arquitecturas #Informática - Trabajos Fin de Grado #CUDA #mapas auto-organizadas, #Matlab
Tipo

info:eu-repo/semantics/bachelorThesis