ARI: Agent Recaptador d'Informació : desenvolupament d'una aplicació que reculli informació de portals web dedicats a la gestió de premsa


Autoria(s): Gómez Pérez, Alejandra
Contribuinte(s)

Patow, Gustavo

Universitat de Girona. Escola Politècnica Superior

Data(s)

01/09/2007

Resumo

Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides

Formato

application/pdf

Identificador

Gómez Pérez, A. (2007). ARI: Agent Recaptador d'Informació : desenvolupament d'una aplicació que reculli informació de portals web dedicats a la gestió de premsa. A 'Enginyeria Informàtica (EINF)'. Girona: Universitat. [Consulta: 22 abril 2012]. Disponible a: http://hdl.handle.net/10256/4304

http://hdl.handle.net/10256/4304

Idioma(s)

cat

Relação

Enginyeria Informàtica (EINF)

Direitos

Aquest document està subjecte a una llicència Creative Commons: Reconeixement – No comercial – Sense obra derivada (by-nc-nd)

http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca

Palavras-Chave #Cercadors d’Internet #Indexació automàtica #Premsa electrònica -- Bases de dades #Web search engines #Automatic indexing #Electronic journals -- Databases
Tipo

info:eu-repo/semantics/bachelorThesis