41 resultados para Computer vision system
Resumo:
Perceiving the world visually is a basic act for humans, but for computers it is still an unsolved problem. The variability present innatural environments is an obstacle for effective computer vision. The goal of invariant object recognition is to recognise objects in a digital image despite variations in, for example, pose, lighting or occlusion. In this study, invariant object recognition is considered from the viewpoint of feature extraction. Thedifferences between local and global features are studied with emphasis on Hough transform and Gabor filtering based feature extraction. The methods are examined with respect to four capabilities: generality, invariance, stability, and efficiency. Invariant features are presented using both Hough transform and Gabor filtering. A modified Hough transform technique is also presented where the distortion tolerance is increased by incorporating local information. In addition, methods for decreasing the computational costs of the Hough transform employing parallel processing and local information are introduced.
Resumo:
This thesis gives an overview of the use of the level set methods in the field of image science. The similar fast marching method is discussed for comparison, also the narrow band and the particle level set methods are introduced. The level set method is a numerical scheme for representing, deforming and recovering structures in an arbitrary dimensions. It approximates and tracks the moving interfaces, dynamic curves and surfaces. The level set method does not define how and why some boundary is advancing the way it is but simply represents and tracks the boundary. The principal idea of the level set method is to represent the N dimensional boundary in the N+l dimensions. This gives the generality to represent even the complex boundaries. The level set methods can be powerful tools to represent dynamic boundaries, but they can require lot of computing power. Specially the basic level set method have considerable computational burden. This burden can be alleviated with more sophisticated versions of the level set algorithm like the narrow band level set method or with the programmable hardware implementation. Also the parallel approach can be used in suitable applications. It is concluded that these methods can be used in a quite broad range of image applications, like computer vision and graphics, scientific visualization and also to solve problems in computational physics. Level set methods and methods derived and inspired by it will be in the front line of image processing also in the future.
Resumo:
Tässä työssä on selvitetty sellutehtaan höyryverkosta tehtaan ulkopuolelle myytävän ylijäämähöyryn määrän ja paineen nopeaan vaihteluun vaikuttavia tekijöitä. Työssä on tarkasteltu höyryn kehityksen ja kulutuksen vaihtelun vaikutusta ylijäämähöyryyn. Lisäksi on tarkasteltu mahdollisuuksia edellä mainittujen häiriöiden tasaamiseksi. Työssä on selvitetty teoriaa, joka vaikuttaa sellutehtaan höyryn kehitykseen ja kulutukseen. Lisäksi on selvitetty energiataselaskennan ja höyryverkon hallintaa parantavien toimenpiteiden teoriaa. Omana kokonaisuutena on sellutehtaan höyryn kehityksen ja kulutuksen tarkastelu sekä selvitys tehtaan höyryverkon hallinnan nykytilasta. Höyryverkolle on muodostettu energiatase. Työn tuloksia varten on kerätty ja tallennettu mittapistetietoa tiedonkeräysjärjestelmän avulla eri höyryverkon mittapisteistä. Työn tuloksina on mainittu useita höyryverkon hallintaa parantavia toteutuskelpoisia asioita ja toimenpiteitä. Työllä on luotu pohjaa menetelmälle, joka ohjaa energian kehitystä vastaamaan sellun tuotannon tarvitsemaa energiamäärää. Samalla saataisiin paremmin hallittua ylijäämähöyryä ja sen määrän sekä paineen vaihtelu vähentyisi.
Resumo:
Vaikka keraamisten laattojen valmistusprosessi onkin täysin automatisoitu, viimeinen vaihe eli laaduntarkistus ja luokittelu tehdään yleensä ihmisvoimin. Automaattinen laaduntarkastus laattojen valmistuksessa voidaan perustella taloudellisuus- ja turvallisuusnäkökohtien avulla. Tämän työn tarkoituksena on kuvata tutkimusprojektia keraamisten laattojen luokittelusta erilaisten väripiirteiden avulla. Oleellisena osana tutkittiin RGB- ja spektrikuvien välistä eroa. Työn teoreettinen osuus käy läpi aiemmin aiheesta tehdyn tutkimuksen sekä antaa taustatietoa konenäöstä, hahmontunnistuksesta, luokittelijoista sekä väriteoriasta. Käytännön osan aineistona oli 25 keraamista laattaa, jotka olivat viidestä eri luokasta. Luokittelussa käytettiin apuna k:n lähimmän naapurin (k-NN) luokittelijaa sekä itseorganisoituvaa karttaa (SOM). Saatuja tuloksia verrattiin myös ihmisten tekemään luokitteluun. Neuraalilaskenta huomattiin tärkeäksi työkaluksi spektrianalyysissä. SOM:n ja spektraalisten piirteiden avulla saadut tulokset olivat lupaavia ja ainoastaan kromatisoidut RGB-piirteet olivat luokittelussa parempia kuin nämä.
Resumo:
Vuosi vuodelta kasvava tietokoneiden prosessointikyky on mahdollistanut harmaataso- ja RGB-värikuvia tarkempien spektrikuvien käsittelyn järjellisessä ajassa ilman suuria kustannuksia. Ongelmana on kuitenkin, ettei talletus- ja tiedonsiirtomedia ole kehittynyt prosessointikyvyn vauhdissa. Ratkaisu tähän ongelmaan on spektrikuvien tiivistäminen talletuksen ja tiedonsiirron ajaksi. Tässä työssä esitellään menetelmä, jossa spektrikuva tiivistetään kahdessa vaiheessa: ensin ryhmittelemällä itseorganisoituvan kartan (SOM) avulla ja toisessa vaiheessa jatketaan tiivistämistä perinteisin menetelmin. Saadut tiivistyssuhteet ovat merkittäviä vääristymän pysyessä siedettävänä. Työ on tehty Lappeenrannan teknillisen korkeakoulun Tietotekniikan osaston Tietojenkäsittelytekniikan tutkimuslaboratoriossa osana laajempaa kuvantiivistyksen tutkimushanketta.
Resumo:
Kolmiulotteisten kappaleiden rekonstruktio on yksi konenäön haastavimmista ongelmista, koska kappaleiden kolmiulotteisia etäisyyksiä ei voida selvittää yhdestä kaksiulotteisesta kuvasta. Ongelma voidaan ratkaista stereonäön avulla, jossa näkymän kolmiulotteinen rakenne päätellään usean kuvan perusteella. Tämä lähestymistapa mahdollistaa kuitenkin vain rekonstruktion niille kappaleiden osille, jotka näkyvät vähintään kahdessa kuvassa. Piilossa olevien osien rekonstruktio ei ole mahdollista pelkästään stereonäön avulla. Tässä työssä on kehitetty uusi menetelmä osittain piilossa olevien kolmiulotteisten tasomaisten kappaleiden rekonstruktioon. Menetelmän avulla voidaan selvittää hyvällä tarkkuudella tasomaisista pinnoista koostuvan kappaleen muoto ja paikka käyttäen kahta kuvaa kappaleesta. Menetelmä perustuu epipolaarigeometriaan, jonka avulla selvitetään molemmissa kuvissa näkyvät kappaleiden osat. Osittain piilossa olevien piirteiden rekonstruointi suoritetaan käyttämäen stereonäköä sekä tietoa kappaleen rakenteesta. Esitettyä ratkaisua voitaisiin käyttää esimerkiksi kolmiulotteisten kappaleiden visualisointiin, robotin navigointiin tai esineentunnistukseen.
Resumo:
Tässä diplomityössä perehdytään matkapuhelimen näytön testaamiseen massatuotannon eri vaiheissa. Pääasialliset keskittymisen kohteet ovat näytön ohjaamiseen tarvittava tasonmuunnin, sen suunnittelu ja toteutus sekä erilaiset näytöntarkastustekniikat. Samalla käydään läpi myös näyttöjen historiaa ja tulevaisuutta, sekä erilaisia konenäköjärjestelmiä. Työssä oli tavoitteena kehittää joustava ratkaisu nykyisten ja tulevien näyttöjen testaukseen ja ohjaamiseen. Tuloksena saatiin tehtävään sopiva tasonmuunnin ja ohjelmisto. Kehitetyt ratkaisut ovat myös helposti muunnettavissa tulevaisuuden tarpeisiin.
Resumo:
Tämä diplomityö tutkii elektroniikka- ja telekommunikaatioteollisuutta sekä siihen läheisesti liittyviä robotteja ja robottijärjestelmiä. Tavoitteena on määrittää E&T-teollisuuden prosesseihin soveltuvien robottien testausmenetelmä. Tavoitteena on myös selvittää kahden ABB:n robotin soveltuvuutta E&T-teollisuuden tarpeisiin. Muutamia systemaattisia valmistusjärjestelmien suunnitteluun soveltuvia menetelmiä ja apuvälineitä on myös käsitelty. Alussa työ keskittyy elektroniikka- ja telekommunikaatioteollisuuden nykytilan tutkimiseen sekä siellä vallitsevien ja ennustettujen trendien kartoitukseen. Kohdat “Collaborative manufacturing” ja E&T-teollisuuden valmistusjärjestelmille asettamat vaatimukset käydään yksityiskohtaisesti läpi. Tutkimuksen pääkohteina ovat robotit, erityisesti ABB:n IRB 140 ja IRB 340 sekä robottien testausmenetelmän määrittäminen. Työssä käydään läpi IRB 340:llä suoritetut testit, jotka tehtiin sekä konenäköjärjestelmää apuna käyttäen että ilman. Myös TTKK:lla suoritetut robottitestit on käyty läpi. Robottien testituloksia on analysoitu ja vertailtu muihin robotteihin. Testausmenetelmät perustuvat ISO 9283 standardiin. Viimeinen osa työstä esittelee robottijärjestelmien systemaattiseen suunnitteluun soveltuvia menetelmiä ja apuvälineitä. Esillä ovat mm. Modular function deployment (MFD) ja The system design method (SDM).
Resumo:
Työssä oli tarkoituksena saada toteutettua kolmiulotteiseen visualisointiin soveltuva ohjelmisto mikrokokoluokkaa olevien kappaleiden konenäköjärjestelmään. Työssä jouduttiin myös jatkokehittämään menetelmää kolmiulotteisen kuvan hankkimiseksi yhdellä kameralla mikrokokoisesta kohteesta. Kohteen kolmiulotteisella kuvalla voitaisiin suorittaa automaattista järjestelmäohjausta. Työssä tutkittiin ja selvitettiin laitteistolla saavutettavia tarkkuuksia ja nopeuksia, sen soveltamiseksi esimerkiksi mikromanipulaattorin ohjaamiseen. Lisäksi tutkittiin erilaisia kohteita joissa voitaisiin hyödyntää kolmiulotteista visualisointia. Tällaisia kohteita on kappaleiden laadunvalvonnassa tai niiden tutkimisessa ja esittämisessä. Syvyystiedon keräävällä menetelmällä oli saavutettava riittävä nopeus, jotta sillä voitaisiin tarvittaessa ohjata reaaliaikaisesti toimilaitteita. Menetelmänä käytettiin "Depth from Focusing" -menetelmää, johon VTT:llä oli jo aiemmin kehitetty automaattinen fokusointiohjelmisto. Työn puitteissa suoritettiin laitteisto- ja menetelmäkehitystä järjestelmän nopeuttamiseksi. Visualisoinnin toteuttamisen eri mahdollisuuksia kartoitettiin ja sellainen toteutettiin rakennettuun konenäköjärjestelmään.
Resumo:
Työn tavoitteena oli edesauttaa Euroelektro International Oy:tä kasvattamaan asiakaskuntaansa löytämällä oikeat lähtökohdat yrityksen markkinoinnin ja myynnin tehostamiselle sekä kannattavien kohdesegmenttien valinnalle. Työssä tehtiin tutkimus, jolla määritettiin yrityksen tyypillinen asiakas, asiakastarpeet, konenäköjärjestelmien ostokriteerit ja –preferenssit sekä ostopäätöksen tekijät ja siihen vaikuttavat henkilöt. Lisäksi selvitettiin, mitkä ovat Euroelektron potentiaalisia ja ei-potentiaalisia teollisuuden aloja. Tutkimuksen tulosten perusteella laadittiin lopuksi yrityksen markkinoinnin ja myynnin kehittämisehdotelma. Tutkimus rajattiin konenäköä jo käyttäviin yrityksiin, konenäön käyttöä suunnitteleviin yrityksiin, yrityksiin, joiden ajateltiin voivan tulevaisuudessa käyttää konenäköä ja yrityksiin, jotka ovat tekemisissä konenäköasiakkaiden kanssa. Markkinointi- ja myyntiprosessien hallintaan yrityksen tulisi kehittää oma seurantaohjelma, jonka avulla valitun markkinointistrategian onnistuneisuutta voitaisiin helposti seurata, sekä laatukäsikirja, mistä löytyisivät standardoidut toimenpidemallit asiakashankintaan, kenttämyyntiin ja myyntiprojektien läpiviemiseen sekä eri toimihenkilöiden toimenkuvaukset ja vastuualueet.
Resumo:
Simultaneous localization and mapping(SLAM) is a very important problem in mobile robotics. Many solutions have been proposed by different scientists during the last two decades, nevertheless few studies have considered the use of multiple sensors simultane¬ously. The solution is on combining several data sources with the aid of an Extended Kalman Filter (EKF). Two approaches are proposed. The first one is to use the ordinary EKF SLAM algorithm for each data source separately in parallel and then at the end of each step, fuse the results into one solution. Another proposed approach is the use of multiple data sources simultaneously in a single filter. The comparison of the computational com¬plexity of the two methods is also presented. The first method is almost four times faster than the second one.
Resumo:
Tässä diplomityössä tutkitaan kolmiulotteisen konenak6järjestelmän soveltuvuutta matkapuhelimien alikokoonpanojen testaukseen massatuotannossa. Tavoitteena oli saada tietoa 3D järjestelmän käytettävyydestä suorituskyvyn ja kapasiteetin suhteen sekä selvittää järjestelmän joustavuutta testattavia tuotteita vaihdettaessa. Haluttiin myös selvittää, että ratkaiseeko 3D järjestelmä käytössä olevan 2D järjestelmän kanssa ilmenneitä ongelmia Järjestelmän suorituskykyä tutkittiin tekemällä testiajoja, joista saatuja tuloksia analysoitiin tilastollisella laadunvalvontaohjelmistolla. Varsinaisen kehitystyön teki konenäköjärjestelmiin erikoistunut alihankkija, jolla on kokemusta 3D testauksesta muilta teollisuuden aloilta. Matkapuhelimien alikokoonpanojen testauksessa laatukriteerit ja tarkkuusvaatimukset ovat kuitenkin liian kovia saavutettaviksi 3D lasertriangulaatioon perustuvaa testausjärjestelmää käytettäessä
Resumo:
This thesis deals with distance transforms which are a fundamental issue in image processing and computer vision. In this thesis, two new distance transforms for gray level images are presented. As a new application for distance transforms, they are applied to gray level image compression. The new distance transforms are both new extensions of the well known distance transform algorithm developed by Rosenfeld, Pfaltz and Lay. With some modification their algorithm which calculates a distance transform on binary images with a chosen kernel has been made to calculate a chessboard like distance transform with integer numbers (DTOCS) and a real value distance transform (EDTOCS) on gray level images. Both distance transforms, the DTOCS and EDTOCS, require only two passes over the graylevel image and are extremely simple to implement. Only two image buffers are needed: The original gray level image and the binary image which defines the region(s) of calculation. No other image buffers are needed even if more than one iteration round is performed. For large neighborhoods and complicated images the two pass distance algorithm has to be applied to the image more than once, typically 3 10 times. Different types of kernels can be adopted. It is important to notice that no other existing transform calculates the same kind of distance map as the DTOCS. All the other gray weighted distance function, GRAYMAT etc. algorithms find the minimum path joining two points by the smallest sum of gray levels or weighting the distance values directly by the gray levels in some manner. The DTOCS does not weight them that way. The DTOCS gives a weighted version of the chessboard distance map. The weights are not constant, but gray value differences of the original image. The difference between the DTOCS map and other distance transforms for gray level images is shown. The difference between the DTOCS and EDTOCS is that the EDTOCS calculates these gray level differences in a different way. It propagates local Euclidean distances inside a kernel. Analytical derivations of some results concerning the DTOCS and the EDTOCS are presented. Commonly distance transforms are used for feature extraction in pattern recognition and learning. Their use in image compression is very rare. This thesis introduces a new application area for distance transforms. Three new image compression algorithms based on the DTOCS and one based on the EDTOCS are presented. Control points, i.e. points that are considered fundamental for the reconstruction of the image, are selected from the gray level image using the DTOCS and the EDTOCS. The first group of methods select the maximas of the distance image to new control points and the second group of methods compare the DTOCS distance to binary image chessboard distance. The effect of applying threshold masks of different sizes along the threshold boundaries is studied. The time complexity of the compression algorithms is analyzed both analytically and experimentally. It is shown that the time complexity of the algorithms is independent of the number of control points, i.e. the compression ratio. Also a new morphological image decompression scheme is presented, the 8 kernels' method. Several decompressed images are presented. The best results are obtained using the Delaunay triangulation. The obtained image quality equals that of the DCT images with a 4 x 4
Resumo:
Tässä työssä kehitettiin teollisuusrobottijärjestelmiin soveltuva, mallinsovitusta hyödyntävä konenäköohjelmisto. Yleiskäyttöiseksi tarkoitettuun ohjelmistoon tehtiin toiminnot konenäköjärjestelmän kalibrointiin, mallinsovitukseen käytettävien mallien hallintaan ja tulosten välitykseen teollisuusroboteille. Ohjelmiston tuli olla myös niin helppokäyttöinen, että sen käyttö onnistuu lyhyellä koulutuksella. Ohjelmistoa sovellettiin puuikkunapuitteiden robotisoituun maalausjärjestelmään. Maalausjärjestelmästä onnistuttiin tekemään automaattinen, tuotteisiin mukautuva ja virhetilanteista toipuva pitkälti toimitetun konenäköjärjestelmän ansiosta.
Resumo:
Local features are used in many computer vision tasks including visual object categorization, content-based image retrieval and object recognition to mention a few. Local features are points, blobs or regions in images that are extracted using a local feature detector. To make use of extracted local features the localized interest points are described using a local feature descriptor. A descriptor histogram vector is a compact representation of an image and can be used for searching and matching images in databases. In this thesis the performance of local feature detectors and descriptors is evaluated for object class detection task. Features are extracted from image samples belonging to several object classes. Matching features are then searched using random image pairs of a same class. The goal of this thesis is to find out what are the best detector and descriptor methods for such task in terms of detector repeatability and descriptor matching rate.