Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data


Autoria(s): Marcelli, Fulvio
Contribuinte(s)

Di Iorio, Angelo

Data(s)

13/07/2016

Resumo

La tesi ha lo scopo di introdurre Investiga, un'applicazione per l'estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione di queste informazioni secondo i principi e i formati Linked Open Data, creata per la tesi. Questa applicazione è basata sul Task 2 della SemPub 2016, una challenge che ha come scopo principale quello di migliorare l'estrazione di informazioni da articoli scientifici in formato PDF. Investiga estrae i capitoli di primo livello, le didascalie delle figure e delle tabelle da un dato articolo e crea un grafo delle informazioni così estratte collegate adeguatamente tra loro. La tesi inoltre analizza gli strumenti esistenti per l'estrazione automatica di informazioni da documenti PDF e dei loro limiti.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/10892/1/tesi.pdf

Marcelli, Fulvio (2016) Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270] <http://amslaurea.unibo.it/view/cds/CDS8009/>

Relação

http://amslaurea.unibo.it/10892/

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #PDF,estrazione,Linked Open Data,dataset RDF #scuola :: 843899 :: Scienze #cds :: 8009 :: Informatica [L-DM270] #sessione :: 4
Tipo

PeerReviewed