Unsupervised visual object categorization


Autoria(s): Kinnunen, Teemu
Data(s)

14/01/2009

14/01/2009

2008

Resumo

The number of digital images has been increasing exponentially in the last few years. People have problems managing their image collections and finding a specific image. An automatic image categorization system could help them to manage images and find specific images. In this thesis, an unsupervised visual object categorization system was implemented to categorize a set of unknown images. The system is unsupervised, and hence, it does not need known images to train the system which needs to be manually obtained. Therefore, the number of possible categories and images can be huge. The system implemented in the thesis extracts local features from the images. These local features are used to build a codebook. The local features and the codebook are then used to generate a feature vector for an image. Images are categorized based on the feature vectors. The system is able to categorize any given set of images based on the visual appearance of the images. Images that have similar image regions are grouped together in the same category. Thus, for example, images which contain cars are assigned to the same cluster. The unsupervised visual object categorization system can be used in many situations, e.g., in an Internet search engine. The system can categorize images for a user, and the user can then easily find a specific type of image.

Digitaalikuvien lukumäärä on kasvanut räjähdysmäisesti viime vuosien aikana. Kuvien suuresta lukumäärästä johtuen niiden selaaminen ja tietyn kuvan löytäminen voi olla vaikeata. Kuvien automaattinen lajittelu auttaa ihmisiä järjestelemään kuvia sekä löytämään tietty kuva useiden muiden kuvien joukosta. Tämän työn tavoitteena on kehittää ohjaamaton kuvien lajittelujärjestelmä. Ohjaamaton järjestelmä ei tarvitse valmiiksi luokiteltuja kuvia järjestelmän opetukseen. Näin ollen, järjestelmä ei tarvitse manuaalisesti kerättyä opetusaineistoa, jolloin kategorioiden lukumäärä voi olla suuri. Menetelmä päättelee automaattisesti sille annetuista kuvista kategoriat, joihin se lajittelee annetut kuvat. Diplomityössä toteutettu järjestelmä irrottaa kuvista paikallisia piirteitä käyttämällä skaalasta riippumattomia tuntomerkkejä. Näistä paikallisista piirteistä muodostetaan koodikirja. Paikallisten piirteiden ja koodikirjan avulla muodostetaan jokaiselle kuvalle oma ominaisuusvektori. Kuvat lajitellaan eri kategorioihin muodostetun ominaisuusvektoreiden perusteella. Järjestelmä voi lajitella mitä tahansa kuvia eri kategorioihin perustuen niiden visuaaliseen sisältöön. Kuvat, joissa on paljon samankaltaisia alueita, laitetaan samaan kategoriaan. Tällöin esimerkiksi kuvat, joissa on autoja, löytyvät samasta kategoriasta. Järjestelmää voidaan hyödyntää monin tavoin, esim. Internetin hakukoneissa. Järjestelmä voi lajitella kuvat automaattisesti niiden sisällön perusteella. Tällöin käyttäjän on helppo etsiä ne kuvat, jotka sisältävät haluttuja objekteja.

Identificador

http://www.doria.fi/handle/10024/43255

URN:NBN:fi-fe200901081016

Idioma(s)

en

Palavras-Chave #tiedonlouhinta #kuvankäsittely #tietokonenäkö #konenäkö #itseorganisoituva kartta #klusterointi #paikallinen piirre #visuaalinen luokittelu #data mining #image processing #computer vision #machine vision #self-organizing map #clustering #bag-of-words #local feature #visual categorization
Tipo

Master's thesis

Diplomityö