Sistema automàtic d'aprenentatge de preferències personals sobre notícies classificades en seccions i definides per paraules clau


Autoria(s): Pueyo Busquets, Jordi
Data(s)

25/06/2014

Resumo

Entrar a una pàgina web de continguts i trobar a l'instant allò que et ve de gust llegir, escoltar o veure en aquell precís instant és un dels somnis de molts internautes. Aquest projecte ha tingut com a objectiu dissenyar un prototip de sistema d'aprenentatge automàtic que va en aquesta línia, dins les possibilitats d'un projecte de final de carrera d'Enginyeria en Informàtica. El programa desenvolupat treballa sobre una mostra de documents classificats en una secció principal i definits per paraules clau. Està pensat per ser vàlid per a qualsevol repositori de dades però s'ha aplicat a un cas concret, l'aprenentatge de gustos sobre notícies del diari britànic 'The Guardian'. L'algoritme té un perfil ideal que modela el cervell d'un lector i un perfil evolutiu, que comença de zero i va aprenent a mesura que l'usuari va consumint notícies. L'aprenentatge s'ha aconseguit fent una simulació d'aquestes tries en dos corpus de notícies d'uns 6.000 articles cadascun. En cada iteració, l'algorisme té en compte un petit grup notícies, a les quals s'assignen dues valoracions, una d'acord amb el perfil ideal i una altra segons el perfil evolutiu. La diferència entre les dues seleccions és la que ens dóna informació per a l'aprenentatge, que s'ha abordat amb dues estratègies. L'aprenentatge online fa una petita variació al perfil evolutiu després de cada tria, mentre que l'offline s'espera a tenir més dades per trobar patrons de conducta i poder fer modificacions més de més magnitud. Després de diverses proves, s'ha comprovat que s'aconsegueix reduir la distància entre valoracions de les seccions principals i tags, comparant el perfil ideal i l'evolutiu abans i després de l'execució de l'algorisme d'aprenentatge.

Identificador

http://hdl.handle.net/10609/32961

Idioma(s)

cat

Publicador

Universitat Oberta de Catalunya

Direitos

<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/es/">http://creativecommons.org/licenses/by-nc-nd/3.0/es/</a>

Palavras-Chave #Intel·ligència artificial #aprenentatge no supervisat #recomanador #notícies #The Guardian #aprenentatge #dades
Tipo

Bachelor thesis