studio e sperimentazione di tecniche di valutazione della significatività statistica in modelli nlp


Autoria(s): Avagnano, Marco
Contribuinte(s)

Carbonaro, Antonella

Frisoni, Giacomo

Data(s)

02/12/2021

Resumo

Negli ultimi anni, il natural language processing ha subito una forte evoluzione, principalmente dettata dai paralleli avanzamenti nell’area del deep-learning. Con dimensioni architetturali in crescita esponenziale e corpora di addestramento sempre più comprensivi, i modelli neurali sono attualmente in grado di generare testo in maniera indistinguibile da quello umano. Tuttavia, a predizioni accurate su task complessi, si contrappongono metriche frequentemente arretrate, non capaci di cogliere le sfumature semantiche o le dimensioni di valutazione richieste. Tale divario motiva ancora oggi l’adozione di una valutazione umana come metodologia standard, ma la natura pervasiva del testo sul Web rende evidente il bisogno di sistemi automatici, scalabili, ed efficienti sia sul piano dei tempi che dei costi. In questa tesi si propone un’analisi delle principali metriche allo stato dell’arte per la valutazione di modelli pre-addestrati, partendo da quelle più popolari come Rouge fino ad arrivare a quelle che a loro volta sfruttano modelli per valutare il testo. Inoltre, si introduce una nuova libreria – denominata Blanche– finalizzata a raccogliere in un unico ambiente le implementazioni dei principali contributi oggi disponibili, agevolando il loro utilizzo da parte di sviluppatori e ricercatori. Infine, si applica Blanche per una valutazione ad ampio spettro dei risultati generativi ottenuti all’interno di un reale caso di studio, incentrato sulla verbalizzazione di eventi biomedici espressi nella letteratura scientifica. Una particolare attenzione è rivolta alla gestione dell’astrattività, un aspetto sempre più cruciale e sfidante sul piano valutativo.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/24764/1/tesi-marco-avagnano.pdf

Avagnano, Marco (2021) studio e sperimentazione di tecniche di valutazione della significatività statistica in modelli nlp. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena <http://amslaurea.unibo.it/view/cds/CDS8615/>

Idioma(s)

it

Publicador

Alma Mater Studiorum - Università di Bologna

Relação

http://amslaurea.unibo.it/24764/

Direitos

cc_by_nc_nd4

Palavras-Chave #Natural Language Processing,Natural Language Generation,Evaluation Metrics,Pre-trained Models,Graph-to-Text,Biomedical events #Ingegneria e scienze informatiche [L-DM270] - Cesena
Tipo

PeerReviewed

info:eu-repo/semantics/bachelorThesis