Arald: an architecture for name resolution, disambiguation and linking of linked data through semantics


Autoria(s): Pellacani, Paolo
Contribuinte(s)

Ciancarini, Paolo

Data(s)

15/07/2015

Resumo

La capacità di estrarre entità da testi, collegarle tra loro ed eliminare possibili ambiguità tra di esse è uno degli obiettivi del Web Semantico. Chiamato anche Web 3.0, esso presenta numerose innovazioni volte ad arricchire il Web con dati strutturati comprensibili sia dagli umani che dai calcolatori. Nel reperimento di questi temini e nella definizione delle entities è di fondamentale importanza la loro univocità. Il nostro orizzonte di lavoro è quello delle università italiane e le entities che vogliamo estrarre, collegare e rendere univoche sono nomi di professori italiani. L’insieme di informazioni di partenza, per sua natura, vede la presenza di ambiguità. Attenendoci il più possibile alla sua semantica, abbiamo studiato questi dati ed abbiamo risolto le collisioni presenti sui nomi dei professori. Arald, la nostra architettura software per il Web Semantico, estrae entità e le collega, ma soprattutto risolve ambiguità e omonimie tra i professori delle università italiane. Per farlo si appoggia alla semantica dei loro lavori accademici e alla rete di coautori desumibile dagli articoli da loro pubblicati, rappresentati tramite un data cluster. In questo docu delle università italiane e le entities che vogliamo estrarre, collegare e rendere univoche sono nomi di professori italiani. Partendo da un insieme di informazioni che, per sua natura, vede la presenza di ambiguità, lo abbiamo studiato attenendoci il più possibile alla sua semantica, ed abbiamo risolto le collisioni che accadevano sui nomi dei professori. Arald, la nostra architettura software per il Web Semantico, estrae entità, le collega, ma soprattutto risolve ambiguità e omonimie tra i professori delle università italiane. Per farlo si appoggia alla semantica dei loro lavori accademici e alla rete di coautori desumibile dagli articoli da loro pubblicati tramite la costruzione di un data cluster.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/8888/1/pellacani_paolo_tesi.pdf

Pellacani, Paolo (2015) Arald: an architecture for name resolution, disambiguation and linking of linked data through semantics. [Laurea magistrale], Università di Bologna, Corso di Studio in Informatica [LM-DM270] <http://amslaurea.unibo.it/view/cds/CDS8028/>

Relação

http://amslaurea.unibo.it/8888/

Direitos

info:eu-repo/semantics/restrictedAccess

Palavras-Chave #Semantic web, linked data, semantic cluster, named entity linking, named entity disambiguation #scuola :: 843899 :: Scienze #cds :: 8028 :: Informatica [LM-DM270] #indirizzo :: 741 :: Curriculum A: Scienze informatiche #sessione :: prima
Tipo

PeerReviewed