prism: rinfrangere distribuzioni di probabilità in riassunti astrattivi mediante strategie di decoding
Contribuinte(s) |
Carbonaro, Antonella Frisoni, Giacomo |
---|---|
Data(s) |
01/12/2022
|
Resumo |
Negli ultimi quattro anni la summarization astrattiva è stata protagonista di una evoluzione senza precedenti dettata da nuovi language model neurali, architetture transformer-based, elevati spazi dimensionali, ampi dataset e innovativi task di pre-training. In questo contesto, le strategie di decoding convertono le distribuzioni di probabilità predette da un modello in un testo artificiale, il quale viene composto in modo auto regressivo. Nonostante il loro cruciale impatto sulla qualità dei riassunti inferiti, il ruolo delle strategie di decoding è frequentemente trascurato e sottovalutato. Di fronte all'elevato numero di tecniche e iperparametri, i ricercatori necessitano di operare scelte consapevoli per ottenere risultati più affini agli obiettivi di generazione. Questa tesi propone il primo studio altamente comprensivo sull'efficacia ed efficienza delle strategie di decoding in task di short, long e multi-document abstractive summarization. Diversamente dalle pubblicazioni disponibili in letteratura, la valutazione quantitativa comprende 5 metriche automatiche, analisi temporali e carbon footprint. I risultati ottenuti dimostrano come non vi sia una strategia di decoding dominante, ma come ciascuna possieda delle caratteristiche adatte a task e dataset specifici. I contributi proposti hanno l'obiettivo di neutralizzare il gap di conoscenza attuale e stimolare lo sviluppo di nuove tecniche di decoding. |
Formato |
application/pdf |
Identificador |
http://amslaurea.unibo.it/27477/1/Prism.pdf Cohen, David (2022) prism: rinfrangere distribuzioni di probabilità in riassunti astrattivi mediante strategie di decoding. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena <http://amslaurea.unibo.it/view/cds/CDS8615/> |
Idioma(s) |
it |
Publicador |
Alma Mater Studiorum - Università di Bologna |
Relação |
http://amslaurea.unibo.it/27477/ |
Direitos |
cc_by_nc_sa4 |
Palavras-Chave | #Decoding Strategy,Transformer,Text Summarization,Natural Language Generation,Natural Language Processing #Ingegneria e scienze informatiche [L-DM270] - Cesena |
Tipo |
PeerReviewed info:eu-repo/semantics/bachelorThesis |