Desarrollo de técnicas de aprendizaje automático para la predicción de resultados de partidos en ligas futbolísiticas


Autoria(s): Moreno Barea, Francisco Javier
Contribuinte(s)

Lenguajes y Ciencias de la Computación

Triviño Salas, Gracián

Data(s)

14/06/2016

14/06/2016

2015

14/06/2016

Resumo

En la actualidad, existen un gran número de investigaciones que usan técnicas de aprendizaje automático basadas en árboles de decisión. Como evolución de dichos trabajos, se han desarrollado métodos que usan Multiclasificadores (Random forest, Boosting, Bagging) que resuelven los mismos problemas abordados con árboles de decisión simples, aumentando el porcentaje de acierto. El ámbito de los problemas resueltos tradicionalmente por dichas técnicas es muy variado aunque destaca la bio-informática. En cualquier caso, la clasificación siempre puede ser consultada a un experto considerándose su respuesta como correcta. Existen problemas donde un experto en la materia no siempre acierta. Un ejemplo, pueden ser las quinielas (1X2). Donde podemos observar que un conocimiento del dominio del problema aumenta el porcentaje de aciertos, sin embargo, predecir un resultado erróneo es muy posible. El motivo es que el número de factores que influyen en un resultado es tan grande que, en muchas ocasiones, convierten la predicción en un acto de azar. En este trabajo pretendemos encontrar un multiclasificador basado en los clasificadores simples más estudiados como pueden ser el Perceptrón Multicapa o Árboles de Decisión con el porcentaje de aciertos más alto posible. Con tal fin, se van a estudiar e implementar una serie de configuraciones de clasificadores propios junto a multiclasificadores desarrollados por terceros. Otra línea de estudio son los propios datos, es decir, el conjunto de entrenamiento. Mediante un estudio del dominio del problema añadiremos nuevos atributos que enriquecen la información que disponemos de cada resultado intentando imitar el conocimiento en el que se basa un experto. Los desarrollos descritos se han realizado en R. Además, se ha realizado una aplicación que permite entrenar un multiclasificador (bien de los propios o bien de los desarrollados por terceros) y como resultado obtenemos la matriz de confusión junto al porcentaje de aciertos. En cuanto a resultados, obtenemos porcentajes de aciertos entre el 50% y el 55%. Por encima del azar y próximos a los resultados de los expertos.

Identificador

http://hdl.handle.net/10630/11638

Idioma(s)

spa

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #Grado en Ingeniería Informática - Trabajos Fin de Grado #Informática - Trabajos Fin de Grado #Análisis multivariante #Aprendizaje automático (Inteligencia artificial) #Minería de datos #sistemas multiclasificadores #Boosting #Árbol de decisión #Liga BBVA
Tipo

info:eu-repo/semantics/bachelorThesis