prism: rinfrangere distribuzioni di probabilità in riassunti astrattivi mediante strategie di decoding


Autoria(s): Cohen, David
Contribuinte(s)

Carbonaro, Antonella

Frisoni, Giacomo

Data(s)

01/12/2022

Resumo

Negli ultimi quattro anni la summarization astrattiva è stata protagonista di una evoluzione senza precedenti dettata da nuovi language model neurali, architetture transformer-based, elevati spazi dimensionali, ampi dataset e innovativi task di pre-training. In questo contesto, le strategie di decoding convertono le distribuzioni di probabilità predette da un modello in un testo artificiale, il quale viene composto in modo auto regressivo. Nonostante il loro cruciale impatto sulla qualità dei riassunti inferiti, il ruolo delle strategie di decoding è frequentemente trascurato e sottovalutato. Di fronte all'elevato numero di tecniche e iperparametri, i ricercatori necessitano di operare scelte consapevoli per ottenere risultati più affini agli obiettivi di generazione. Questa tesi propone il primo studio altamente comprensivo sull'efficacia ed efficienza delle strategie di decoding in task di short, long e multi-document abstractive summarization. Diversamente dalle pubblicazioni disponibili in letteratura, la valutazione quantitativa comprende 5 metriche automatiche, analisi temporali e carbon footprint. I risultati ottenuti dimostrano come non vi sia una strategia di decoding dominante, ma come ciascuna possieda delle caratteristiche adatte a task e dataset specifici. I contributi proposti hanno l'obiettivo di neutralizzare il gap di conoscenza attuale e stimolare lo sviluppo di nuove tecniche di decoding.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/27477/1/Prism.pdf

Cohen, David (2022) prism: rinfrangere distribuzioni di probabilità in riassunti astrattivi mediante strategie di decoding. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena <http://amslaurea.unibo.it/view/cds/CDS8615/>

Idioma(s)

it

Publicador

Alma Mater Studiorum - Università di Bologna

Relação

http://amslaurea.unibo.it/27477/

Direitos

cc_by_nc_sa4

Palavras-Chave #Decoding Strategy,Transformer,Text Summarization,Natural Language Generation,Natural Language Processing #Ingegneria e scienze informatiche [L-DM270] - Cesena
Tipo

PeerReviewed

info:eu-repo/semantics/bachelorThesis