Implementación eficiente de redes neuronales autoorganizadas en CUDA C/C++.
Contribuinte(s) |
Lenguajes y Ciencias de la Computación Domínguez Merino, Enrique |
---|---|
Data(s) |
01/06/2016
01/06/2016
01/12/2015
01/06/2016
|
Resumo |
En este documento se expondrá una implementación del problema del viajante de comercio usando una implementación personalizada de un mapa auto-organizado basándose en soluciones anteriores y adaptándolas a la arquitectura CUDA, haciendo a la vez una comparativa de la implementación eficiente en CUDA C/C++ con la implementación de las funciones de GPU incluidas en el Parallel Computing Toolbox de Matlab. La solución que se da reduce en casi un cuarto las iteraciones necesarias para llegar a una solución buena del problema mencionado, además de la mejora inminente del uso de las arquitecturas paralelas. En esta solución se estudia la mejora en tiempo que se consigue con el uso específico de la memoria compartida, siendo esta una de las herramientas más potentes para mejorar el rendimiento. En lo referente a los tiempos de ejecución, se llega a concluir que la mejor solución es el lanzamiento de un kernel de CUDA desde Matlab a través de la funcionalidad incluida en el Parallel Computing Toolbox. |
Identificador | |
Idioma(s) |
spa |
Direitos |
info:eu-repo/semantics/openAccess |
Palavras-Chave | #Grado en Ingeniería Informática - Trabajos Fin de Grado #Redes neuronales artificiales - Arquitecturas #Informática - Trabajos Fin de Grado #CUDA #mapas auto-organizadas, #Matlab |
Tipo |
info:eu-repo/semantics/bachelorThesis |