TARO: Infrastruttura per il Confronto di Testate Giornalistiche Internazionali


Autoria(s): Carrino, Giuseppe
Contribuinte(s)

Di Iorio, Angelo

Barabucci, Gioele

Data(s)

13/07/2022

Resumo

TARO (Tons of Articles Ready to Outline) è un progetto che ha come scopo quello di realizzare un sistema per la raccolta, l'analisi e il confronto di articoli di giornali online. Sono state scelte come fonti testate giornalistiche internazionali e i loro canali di pubblicazione, come ad esempio i Feed RSS e le Homepage. Gli articoli vengono quindi analizzati attraverso NER e Sentiment Analysis per poi individuare quali argomenti siano trattati da più testate e quali invece risultino esclusivi di una sola, sfruttando algoritmi di similarità. Il progetto è sviluppato in Python e sono utilizzate diverse librerie, tra cui Scrapy, per la raccolta di articoli, Argos, per la traduzione delle notizie al fine di allinearle linguisticamente, SpaCy, per le analisi semantiche, e Pandas per la visualizzazione dei risultati ottenuti. Uno degli obiettivi è sfruttare questa pipeline al fine di effettuare analisi socio-culturali interessanti utilizzando le informazioni date dagli articoli giornalistici stessi, oltre che osservare le potenzialità delle analisi semantiche fatte su notiziari.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/26208/1/TESI_FINALE.pdf

Carrino, Giuseppe (2022) TARO: Infrastruttura per il Confronto di Testate Giornalistiche Internazionali. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270] <http://amslaurea.unibo.it/view/cds/CDS8009/>

Idioma(s)

it

Publicador

Alma Mater Studiorum - Università di Bologna

Relação

http://amslaurea.unibo.it/26208/

Direitos

Free to read

Palavras-Chave #Giornalismo,Notizie,Similarità,Python,Argos,SpaCy,Pandas,Scrapy,confronto #Informatica [L-DM270]
Tipo

PeerReviewed

info:eu-repo/semantics/bachelorThesis