studio e sperimentazione di tecniche di valutazione della significatività statistica in modelli nlp
| Contribuinte(s) |
Carbonaro, Antonella Frisoni, Giacomo |
|---|---|
| Data(s) |
02/12/2021
|
| Resumo |
Negli ultimi anni, il natural language processing ha subito una forte evoluzione, principalmente dettata dai paralleli avanzamenti nell’area del deep-learning. Con dimensioni architetturali in crescita esponenziale e corpora di addestramento sempre più comprensivi, i modelli neurali sono attualmente in grado di generare testo in maniera indistinguibile da quello umano. Tuttavia, a predizioni accurate su task complessi, si contrappongono metriche frequentemente arretrate, non capaci di cogliere le sfumature semantiche o le dimensioni di valutazione richieste. Tale divario motiva ancora oggi l’adozione di una valutazione umana come metodologia standard, ma la natura pervasiva del testo sul Web rende evidente il bisogno di sistemi automatici, scalabili, ed efficienti sia sul piano dei tempi che dei costi. In questa tesi si propone un’analisi delle principali metriche allo stato dell’arte per la valutazione di modelli pre-addestrati, partendo da quelle più popolari come Rouge fino ad arrivare a quelle che a loro volta sfruttano modelli per valutare il testo. Inoltre, si introduce una nuova libreria – denominata Blanche– finalizzata a raccogliere in un unico ambiente le implementazioni dei principali contributi oggi disponibili, agevolando il loro utilizzo da parte di sviluppatori e ricercatori. Infine, si applica Blanche per una valutazione ad ampio spettro dei risultati generativi ottenuti all’interno di un reale caso di studio, incentrato sulla verbalizzazione di eventi biomedici espressi nella letteratura scientifica. Una particolare attenzione è rivolta alla gestione dell’astrattività, un aspetto sempre più cruciale e sfidante sul piano valutativo. |
| Formato |
application/pdf |
| Identificador |
http://amslaurea.unibo.it/24764/1/tesi-marco-avagnano.pdf Avagnano, Marco (2021) studio e sperimentazione di tecniche di valutazione della significatività statistica in modelli nlp. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena <http://amslaurea.unibo.it/view/cds/CDS8615/> |
| Idioma(s) |
it |
| Publicador |
Alma Mater Studiorum - Università di Bologna |
| Relação |
http://amslaurea.unibo.it/24764/ |
| Direitos |
cc_by_nc_nd4 |
| Palavras-Chave | #Natural Language Processing,Natural Language Generation,Evaluation Metrics,Pre-trained Models,Graph-to-Text,Biomedical events #Ingegneria e scienze informatiche [L-DM270] - Cesena |
| Tipo |
PeerReviewed info:eu-repo/semantics/bachelorThesis |