Metodologie di Corrispondenza Stereo Basate su Deep Learning per Superfici Altamente Riflettenti e Trasparenti: Dataset e Architettura


Autoria(s): Pumilia, Andrea
Contribuinte(s)

Di Stefano, Luigi

Zama Ramirez, Pierluigi

Tosi, Fabio

Data(s)

19/07/2022

Resumo

Nell’ambito della Stereo Vision, settore della Computer Vision, partendo da coppie di immagini RGB, si cerca di ricostruire la profondità della scena. La maggior parte degli algoritmi utilizzati per questo compito ipotizzano che tutte le superfici presenti nella scena siano lambertiane. Quando sono presenti superfici non lambertiane (riflettenti o trasparenti), gli algoritmi stereo esistenti sbagliano la predizione della profondità. Per risolvere questo problema, durante l’esperienza di tirocinio, si è realizzato un dataset contenente oggetti trasparenti e riflettenti che sono la base per l’allenamento della rete. Agli oggetti presenti nelle scene sono associate annotazioni 3D usate per allenare la rete. Invece, nel seguente lavoro di tesi, utilizzando l’algoritmo RAFT-Stereo [1], rete allo stato dell’arte per la stereo vision, si analizza come la rete modifica le sue prestazioni (predizione della disparità) se al suo interno viene inserito un modulo per la segmentazione semantica degli oggetti. Si introduce questo layer aggiuntivo perché, trovare la corrispondenza tra due punti appartenenti a superfici lambertiane, risulta essere molto complesso per una normale rete. Si vuole utilizzare l’informazione semantica per riconoscere questi tipi di superfici e così migliorarne la disparità. È stata scelta questa architettura neurale in quanto, durante l’esperienza di tirocinio riguardante la creazione del dataset Booster [2], è risultata la migliore su questo dataset. L’obiettivo ultimo di questo lavoro è vedere se il riconoscimento di superfici non lambertiane, da parte del modulo semantico, influenza la predizione della disparità migliorandola. Nell’ambito della stereo vision, gli elementi riflettenti e trasparenti risultano estremamente complessi da analizzare, ma restano tuttora oggetto di studio dati gli svariati settori di applicazione come la guida autonoma e la robotica.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/26388/1/TESI_Andrea_Pumilia.pdf

Pumilia, Andrea (2022) Metodologie di Corrispondenza Stereo Basate su Deep Learning per Superfici Altamente Riflettenti e Trasparenti: Dataset e Architettura. [Laurea], Università di Bologna, Corso di Studio in Ingegneria elettronica e telecomunicazioni [L-DM270] <http://amslaurea.unibo.it/view/cds/CDS9065/>

Idioma(s)

it

Publicador

Alma Mater Studiorum - Università di Bologna

Relação

http://amslaurea.unibo.it/26388/

Direitos

Free to read

Palavras-Chave #stereo vision,RAFT-Stereo,semantic segmentation,deep learning,Non-lambertian surfaces,High-resolution images #Ingegneria elettronica e telecomunicazioni [L-DM270]
Tipo

PeerReviewed

info:eu-repo/semantics/bachelorThesis