TARO: Infrastruttura per il Confronto di Testate Giornalistiche Internazionali
Contribuinte(s) |
Di Iorio, Angelo Barabucci, Gioele |
---|---|
Data(s) |
13/07/2022
|
Resumo |
TARO (Tons of Articles Ready to Outline) è un progetto che ha come scopo quello di realizzare un sistema per la raccolta, l'analisi e il confronto di articoli di giornali online. Sono state scelte come fonti testate giornalistiche internazionali e i loro canali di pubblicazione, come ad esempio i Feed RSS e le Homepage. Gli articoli vengono quindi analizzati attraverso NER e Sentiment Analysis per poi individuare quali argomenti siano trattati da più testate e quali invece risultino esclusivi di una sola, sfruttando algoritmi di similarità. Il progetto è sviluppato in Python e sono utilizzate diverse librerie, tra cui Scrapy, per la raccolta di articoli, Argos, per la traduzione delle notizie al fine di allinearle linguisticamente, SpaCy, per le analisi semantiche, e Pandas per la visualizzazione dei risultati ottenuti. Uno degli obiettivi è sfruttare questa pipeline al fine di effettuare analisi socio-culturali interessanti utilizzando le informazioni date dagli articoli giornalistici stessi, oltre che osservare le potenzialità delle analisi semantiche fatte su notiziari. |
Formato |
application/pdf |
Identificador |
http://amslaurea.unibo.it/26208/1/TESI_FINALE.pdf Carrino, Giuseppe (2022) TARO: Infrastruttura per il Confronto di Testate Giornalistiche Internazionali. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270] <http://amslaurea.unibo.it/view/cds/CDS8009/> |
Idioma(s) |
it |
Publicador |
Alma Mater Studiorum - Università di Bologna |
Relação |
http://amslaurea.unibo.it/26208/ |
Direitos |
Free to read |
Palavras-Chave | #Giornalismo,Notizie,Similarità,Python,Argos,SpaCy,Pandas,Scrapy,confronto #Informatica [L-DM270] |
Tipo |
PeerReviewed info:eu-repo/semantics/bachelorThesis |