36 resultados para supervised neighbor embedding
em Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland
Resumo:
Tässä diplomityössä tutkitaan tekniikoita, joillavesileima lisätään spektrikuvaan, ja menetelmiä, joilla vesileimat tunnistetaanja havaitaan spektrikuvista. PCA (Principal Component Analysis) -algoritmia käyttäen alkuperäisten kuvien spektriulottuvuutta vähennettiin. Vesileiman lisääminen spektrikuvaan suoritettiin muunnosavaruudessa. Ehdotetun mallin mukaisesti muunnosavaruuden komponentti korvattiin vesileiman ja toisen muunnosavaruuden komponentin lineaarikombinaatiolla. Lisäyksessä käytettävää parametrijoukkoa tutkittiin. Vesileimattujen kuvien laatu mitattiin ja analysoitiin. Suositukset vesileiman lisäykseen esitettiin. Useita menetelmiä käytettiin vesileimojen tunnistamiseen ja tunnistamisen tulokset analysoitiin. Vesileimojen kyky sietää erilaisia hyökkäyksiä tarkistettiin. Diplomityössä suoritettiin joukko havaitsemis-kokeita ottamalla huomioon vesileiman lisäyksessä käytetyt parametrit. ICA (Independent Component Analysis) -menetelmää pidetään yhtenä mahdollisena vaihtoehtona vesileiman havaitsemisessa.
Resumo:
This thesis is about detection of local image features. The research topic belongs to the wider area of object detection, which is a machine vision and pattern recognition problem where an object must be detected (located) in an image. State-of-the-art object detection methods often divide the problem into separate interest point detection and local image description steps, but in this thesis a different technique is used, leading to higher quality image features which enable more precise localization. Instead of using interest point detection the landmark positions are marked manually. Therefore, the quality of the image features is not limited by the interest point detection phase and the learning of image features is simplified. The approach combines both interest point detection and local description into one phase for detection. Computational efficiency of the descriptor is therefore important, leaving out many of the commonly used descriptors as unsuitably heavy. Multiresolution Gabor features has been the main descriptor in this thesis and improving their efficiency is a significant part. Actual image features are formed from descriptors by using a classifierwhich can then recognize similar looking patches in new images. The main classifier is based on Gaussian mixture models. Classifiers are used in one-class classifier configuration where there are only positive training samples without explicit background class. The local image feature detection method has been tested with two freely available face detection databases and a proprietary license plate database. The localization performance was very good in these experiments. Other applications applying the same under-lying techniques are also presented, including object categorization and fault detection.
Resumo:
The subject of the thesis is automatic sentence compression with machine learning, so that the compressed sentences remain both grammatical and retain their essential meaning. There are multiple possible uses for the compression of natural language sentences. In this thesis the focus is generation of television program subtitles, which often are compressed version of the original script of the program. The main part of the thesis consists of machine learning experiments for automatic sentence compression using different approaches to the problem. The machine learning methods used for this work are linear-chain conditional random fields and support vector machines. Also we take a look which automatic text analysis methods provide useful features for the task. The data used for machine learning is supplied by Lingsoft Inc. and consists of subtitles in both compressed an uncompressed form. The models are compared to a baseline system and comparisons are made both automatically and also using human evaluation, because of the potentially subjective nature of the output. The best result is achieved using a CRF - sequence classification using a rich feature set. All text analysis methods help classification and most useful method is morphological analysis. Tutkielman aihe on suomenkielisten lauseiden automaattinen tiivistäminen koneellisesti, niin että lyhennetyt lauseet säilyttävät olennaisen informaationsa ja pysyvät kieliopillisina. Luonnollisen kielen lauseiden tiivistämiselle on monta käyttötarkoitusta, mutta tässä tutkielmassa aihetta lähestytään television ohjelmien tekstittämisen kautta, johon käytännössä kuuluu alkuperäisen tekstin lyhentäminen televisioruudulle paremmin sopivaksi. Tutkielmassa kokeillaan erilaisia koneoppimismenetelmiä tekstin automaatiseen lyhentämiseen ja tarkastellaan miten hyvin erilaiset luonnollisen kielen analyysimenetelmät tuottavat informaatiota, joka auttaa näitä menetelmiä lyhentämään lauseita. Lisäksi tarkastellaan minkälainen lähestymistapa tuottaa parhaan lopputuloksen. Käytetyt koneoppimismenetelmät ovat tukivektorikone ja lineaarisen sekvenssin mallinen CRF. Koneoppimisen tukena käytetään tekstityksiä niiden eri käsittelyvaiheissa, jotka on saatu Lingsoft OY:ltä. Luotuja malleja vertaillaan Lopulta mallien lopputuloksia evaluoidaan automaattisesti ja koska teksti lopputuksena on jossain määrin subjektiivinen myös ihmisarviointiin perustuen. Vertailukohtana toimii kirjallisuudesta poimittu menetelmä. Tutkielman tuloksena paras lopputulos saadaan aikaan käyttäen CRF sekvenssi-luokittelijaa laajalla piirrejoukolla. Kaikki kokeillut teksin analyysimenetelmät auttavat luokittelussa, joista tärkeimmän panoksen antaa morfologinen analyysi.
Resumo:
The primary goals of this study are to: embed sustainable concepts of energy consumption into certain part of existing Computer Science curriculum for English schools; investigate how to motivate 7-to-11 years old kids to learn these concepts; promote responsive ICT (Information and Communications Technology) use by these kids in their daily life; raise their awareness of today’s ecological challenges. Sustainability-related ICT lessons developed aim to provoke computational thinking and creativity to foster understanding of environmental impact of ICT and positive environmental impact of small changes in user energy consumption behaviour. The importance of including sustainability into the Computer Science curriculum is due to the fact that ICT is both a solution and one of the causes of current world ecological problems. This research follows Agile software development methodology. In order to achieve the aforementioned goals, sustainability requirements, curriculum requirements and technical requirements are firstly analysed. Secondly, the web-based user interface is designed. In parallel, a set of three online lessons (video, slideshow and game) is created for the website GreenICTKids.com taking into account several green design patterns. Finally, the evaluation phase involves the collection of adults’ and kids’ feedback on the following: user interface; contents; user interaction; impacts on the kids’ sustainability awareness and on the kids’ behaviour with technologies. In conclusion, a list of research outcomes is as follows: 92% of the adults learnt more about energy consumption; 80% of the kids are motivated to learn about energy consumption and found the website easy to use; 100% of the kids understood the contents and liked website’s visual aspect; 100% of the kids will try to apply in their daily life what they learnt through the online lessons.
Resumo:
During spermatogenesis, different genes are expressed in a strictly coordinated fashion providing an excellent model to study cell differentiation. Recent identification of testis specific genes and the development of green fluorescence protein (GFP) transgene technology and an in vivo system for studying the differentiation of transplanted male germ cells in infertile testis has opened new possibilities for studying the male germ cell differentiation at molecular level. We have employed these techniques in combination with transillumination based stage recognition (Parvinen and Vanha-Perttula, 1972) and squash preparation techniques (Parvinen and Hecht, 1981) to study the regulation of male germ cell differentiation. By using transgenic mice expressing enhanced-(E)GFP as a marker we have studied the expression and hormonal regulation of beta-actin and acrosin proteins in the developmentally different living male germ cells. Beta-actin was demonstrated in all male germ cells, whereas acrosin was expressed only in late meiotic and in postmeiotic cells. Follicle stimulating hormone stimulated b-actin-EGFP expression at stages I-VI and enhanced the formation of microtubules in spermatids and this way reduced the size of the acrosomic system. When EGFP expressing spermatogonial stem cells were transplanted into infertile mouse testis differentiation and the synchronized development of male germ cells could be observed during six months observation time. Each colony developed independently and maintained typical stage-dependent cell associations. Furthermore, if more than two colonies were fused, each of them was adjusted to one stage and synchronized. By studying living spermatids we were able to demonstrate novel functions for Golgi complex and chromatoid body in material sharing between neighbor spermatids. Immunosytochemical analyses revealed a transport of haploid cell specific proteins in spermatids (TRA54 and Shippo1) and through the intercellular bridges (TRA54). Cytoskeleton inhibitor (nocodazole) demonstrated the importance of microtubules in material sharing between spermatids and in preserving the integrity of the chromatoid body. Golgi complex inhibitor, brefeldin A, revealed the great importance of Golgi complex i) in acrosomic system formation ii) TRA54 translation and in iii) granule trafficking between spermatids.
Resumo:
Puhdastilojen suunnittelussa pyritään saamaan hallittu ja valvottu ilmanpuhtaus luokiteltuun tilaan.Luokittelu tapahtuu puhdastilastandardeilla, lisäksi lääkevalmisteita valmistettavassa tilassa GMP -säädösten mukaisin luokituksin. Puhdastilastandardi ISO 14644 käsittää seitsemän osaa, jossa on käsitelty puhdastilaa koskevia määräyksiä suunnittelusta käyttöön ja testaukseen. GMP-säädökset sisältävät yhdeksän kappaletta, joista kappale 3: 'Tilat ja laitteet' on keskeinen osa lääkeainevalmistuksen puhdastilasuunnittelua. Puhtaan ilman aikaansaamiseksi puhdastilaan merkittävimmät roolit ovat ilmanvaihdolla, puhdastilarakenteilla ja rakennusautomaatiolla. Ilma voidaan tuoda tilaan kolmella eri periaatteella. Ilmaa tuodaan tilaan yhdensuuntaisesti, turbulenttisesti tai sekavirtauksena HEPA -suodattimien kautta, joilla varmistetaan epäpuhtauksien korkea suodatusaste. Ilmapoistetaan rei'itettyjen, korotettujen lattioiden kautta tai tilan alaosassa olevien poistoilmasäleikköjen kautta, josta se johdetaan noin 75-90%:sti kierrätettynä takaisin tilaan. Lääketeollisuudessa rei'itettyjä, korotettuja lattioita eivoida käyttää kontaminaatiovaaran, vuoksi. Tilaan suunniteltuja olosuhteita ylläpidetään rakennusautomaation avulla ja monitorointijärjestelmällä valvotaan tilassa olevan ilman laatua. Kaikki GMP-luokituksen mukaiset puhdastilat tulee validoida. Validointiin kuuluu teknisten järjestelmien kvalifiointi ja koko prosessin validointi. Teknisten järjestel-mien kvalifiointi käsittää suunnitelmien tarkastuksen (DQ), asennus - ja käyttöönotto tarkastukset (IQ), toiminnan testauksen (OQ) ja suorituksen testauksen (PQ). Kvali-fiointi kuuluu yhtenä osa-alueena validointiin. Prosessin validointi on osa yrityksen laadunvarmistusta. Validoinnilla hankitaan dokumentoidut todisteet siitä, että tila tai prosessi todella täyttää annetut vaatimukset. Tässä työssä laadittiin esimerkinomainen kvalifiointisuunnitelma puhdastilan tekni-sille järjestelmille. Suunnitelma sisältää asennus- ja käyttöönoton mukaiset tarkastukset (IQ)ja toiminnan aikaiset testaukset (OQ).
Resumo:
Paperin pinnan karheus on yksi paperin laatukriteereistä. Sitä mitataan fyysisestipaperin pintaa mittaavien laitteiden ja optisten laitteiden avulla. Mittaukset vaativat laboratorioolosuhteita, mutta nopeammille, suoraan linjalla tapahtuville mittauksilla olisi tarvetta paperiteollisuudessa. Paperin pinnan karheus voidaan ilmaista yhtenä näytteelle kohdistuvana karheusarvona. Tässä työssä näyte on jaettu merkitseviin alueisiin, ja jokaiselle alueelle on laskettu erillinen karheusarvo. Karheuden mittaukseen on käytetty useita menetelmiä. Yleisesti hyväksyttyä tilastollista menetelmää on käytetty tässä työssä etäisyysmuunnoksen lisäksi. Paperin pinnan karheudenmittauksessa on ollut tarvetta jakaa analysoitava näyte karheuden perusteella alueisiin. Aluejaon avulla voidaan rajata näytteestä selvästi karheampana esiintyvät alueet. Etäisyysmuunnos tuottaa alueita, joita on analysoitu. Näistä alueista on muodostettu yhtenäisiä alueita erilaisilla segmentointimenetelmillä. PNN -menetelmään (Pairwise Nearest Neighbor) ja naapurialueiden yhdistämiseen perustuvia algoritmeja on käytetty.Alueiden jakamiseen ja yhdistämiseen perustuvaa lähestymistapaa on myös tarkasteltu. Segmentoitujen kuvien validointi on yleensä tapahtunut ihmisen tarkastelemana. Tämän työn lähestymistapa on verrata yleisesti hyväksyttyä tilastollista menetelmää segmentoinnin tuloksiin. Korkea korrelaatio näiden tulosten välillä osoittaa onnistunutta segmentointia. Eri kokeiden tuloksia on verrattu keskenään hypoteesin testauksella. Työssä on analysoitu kahta näytesarjaa, joidenmittaukset on suoritettu OptiTopolla ja profilometrillä. Etäisyysmuunnoksen aloitusparametrit, joita muutettiin kokeiden aikana, olivat aloituspisteiden määrä ja sijainti. Samat parametrimuutokset tehtiin kaikille algoritmeille, joita käytettiin alueiden yhdistämiseen. Etäisyysmuunnoksen jälkeen korrelaatio oli voimakkaampaa profilometrillä mitatuille näytteille kuin OptiTopolla mitatuille näytteille. Segmentoiduilla OptiTopo -näytteillä korrelaatio parantui voimakkaammin kuin profilometrinäytteillä. PNN -menetelmän tuottamilla tuloksilla korrelaatio oli paras.
Resumo:
This thesis studies gray-level distance transforms, particularly the Distance Transform on Curved Space (DTOCS). The transform is produced by calculating distances on a gray-level surface. The DTOCS is improved by definingmore accurate local distances, and developing a faster transformation algorithm. The Optimal DTOCS enhances the locally Euclidean Weighted DTOCS (WDTOCS) with local distance coefficients, which minimize the maximum error from the Euclideandistance in the image plane, and produce more accurate global distance values.Convergence properties of the traditional mask operation, or sequential localtransformation, and the ordered propagation approach are analyzed, and compared to the new efficient priority pixel queue algorithm. The Route DTOCS algorithmdeveloped in this work can be used to find and visualize shortest routes between two points, or two point sets, along a varying height surface. In a digital image, there can be several paths sharing the same minimal length, and the Route DTOCS visualizes them all. A single optimal path can be extracted from the route set using a simple backtracking algorithm. A new extension of the priority pixel queue algorithm produces the nearest neighbor transform, or Voronoi or Dirichlet tessellation, simultaneously with the distance map. The transformation divides the image into regions so that each pixel belongs to the region surrounding the reference point, which is nearest according to the distance definition used. Applications and application ideas for the DTOCS and its extensions are presented, including obstacle avoidance, image compression and surface roughness evaluation.
Resumo:
Technological progress has made a huge amount of data available at increasing spatial and spectral resolutions. Therefore, the compression of hyperspectral data is an area of active research. In somefields, the original quality of a hyperspectral image cannot be compromised andin these cases, lossless compression is mandatory. The main goal of this thesisis to provide improved methods for the lossless compression of hyperspectral images. Both prediction- and transform-based methods are studied. Two kinds of prediction based methods are being studied. In the first method the spectra of a hyperspectral image are first clustered and and an optimized linear predictor is calculated for each cluster. In the second prediction method linear prediction coefficients are not fixed but are recalculated for each pixel. A parallel implementation of the above-mentioned linear prediction method is also presented. Also,two transform-based methods are being presented. Vector Quantization (VQ) was used together with a new coding of the residual image. In addition we have developed a new back end for a compression method utilizing Principal Component Analysis (PCA) and Integer Wavelet Transform (IWT). The performance of the compressionmethods are compared to that of other compression methods. The results show that the proposed linear prediction methods outperform the previous methods. In addition, a novel fast exact nearest-neighbor search method is developed. The search method is used to speed up the Linde-Buzo-Gray (LBG) clustering method.
Resumo:
The purpose of this study was to analyse the nursing student-patient relationship and factors associated with this relationship from the point of view of both students and patients, and to identify factors that predict the type of relationship. The ultimate goal is to improve supervised clinical practicum with a view to supporting students in their reciprocal collaborative relationships with patients, increase their preparedness to meet patients’ health needs, and thus to enhance the quality of patient care. The study was divided into two phases. In the first phase (1999-2005), a literature review concerning the student-patient relationship was conducted (n=104 articles) and semi-structured interviews carried out with nursing students (n=30) and internal medicine patients (n=30). Data analysis was by means of qualitative content analysis and Student-Patient Relationship Scales, which were specially developed for this research. In the second phase (2005-2007), the data were collected by SPR scales among nursing students (n=290) and internal medicine patients (n=242). The data were analysed statistically by SPSS 12.0 software. The results revealed three types of student-patient relationship: a mechanistic relationship focusing on the student’s learning needs; an authoritative relationship focusing on what the student assumes is in the patient’s best interest; and a facilitative relationship focusing on the common good of both student and patient. Students viewed their relationship with patients more often as facilitative and authoritative than mechanistic, while in patients’ assessments the authoritative relationship occurred most frequently and the facilitative relationship least frequently. Furthermore, students’ and patients’ views on their relationships differed significantly. A number of background factors, contextual factors and consequences of the relationship were found to be associated with the type of relationship. In the student data, factors that predicted the type of relationship were age, current year of study and support received in the relationship with patient. The higher the student’s age, the more likely the relationship with the patient was facilitative. Fourth year studies and the support of a person other than a supervisor were significantly associated with an authoritative relationship. Among patients, several factors were found to predict the type of nursing student-patient relationships. Significant factors associated with a facilitative relationship were university-level education, several previous hospitalizations, admission to hospital for a medical problem, experience of caring for an ill family member and patient’s positive perception of atmosphere during collaboration and of student’s personal and professional growth. In patients, positive perceptions of student’s personal and professional attributes and patient’s improved health and a greater commitment to self-care, on the other hand, were significantly associated with an authoritative relationship, whereas positive perceptions of one’s own attributes as a patient were significantly associated with a mechanistic relationship. It is recommended that further research on the student-patient relationship and related factors should focus on questions of content, methodology and education.
Resumo:
In this thesis author approaches the problem of automated text classification, which is one of basic tasks for building Intelligent Internet Search Agent. The work discusses various approaches to solving sub-problems of automated text classification, such as feature extraction and machine learning on text sources. Author also describes her own multiword approach to feature extraction and pres-ents the results of testing this approach using linear discriminant analysis based classifier, and classifier combining unsupervised learning for etalon extraction with supervised learning using common backpropagation algorithm for multilevel perceptron.
Resumo:
Vaikka keraamisten laattojen valmistusprosessi onkin täysin automatisoitu, viimeinen vaihe eli laaduntarkistus ja luokittelu tehdään yleensä ihmisvoimin. Automaattinen laaduntarkastus laattojen valmistuksessa voidaan perustella taloudellisuus- ja turvallisuusnäkökohtien avulla. Tämän työn tarkoituksena on kuvata tutkimusprojektia keraamisten laattojen luokittelusta erilaisten väripiirteiden avulla. Oleellisena osana tutkittiin RGB- ja spektrikuvien välistä eroa. Työn teoreettinen osuus käy läpi aiemmin aiheesta tehdyn tutkimuksen sekä antaa taustatietoa konenäöstä, hahmontunnistuksesta, luokittelijoista sekä väriteoriasta. Käytännön osan aineistona oli 25 keraamista laattaa, jotka olivat viidestä eri luokasta. Luokittelussa käytettiin apuna k:n lähimmän naapurin (k-NN) luokittelijaa sekä itseorganisoituvaa karttaa (SOM). Saatuja tuloksia verrattiin myös ihmisten tekemään luokitteluun. Neuraalilaskenta huomattiin tärkeäksi työkaluksi spektrianalyysissä. SOM:n ja spektraalisten piirteiden avulla saadut tulokset olivat lupaavia ja ainoastaan kromatisoidut RGB-piirteet olivat luokittelussa parempia kuin nämä.
Resumo:
Suomessa sähkönjakeluverkkoyhtiöt toimivat verkkovastuualueillaan yksinoikeudella. Verkkovastuualuiden ominaispiirteet voivat olla hyvin erilaiset. Energiamarkkinavirasto valvoo sähkömarkkinalainsäädännön noudattamista jakeluverkkotoiminnassa. Jakeluverkonhaltijat on velvoitettu Energiamarkkinaviraston valvontamallin kautta määrittämään tiettyjen rajoitusten mukaisesti verkkokomponenteillensa sopivimmat teknistaloudelliset pitoajat. Nämä pitoajat vaikuttavat varsinkin verkkoyhtiön tuottomahdollisuuksiin ja asiakkaiden siirtohintoihin. Lisäksi huomioon on otettava jaettavan sähkön laatu, verkon käyttövarmuus sekä vaikutukset ympäristöön ja turvallisuuteen. Pitoaikojen matemaattinen mallintaminen on usein monimutkaista. Teknistaloudellinen pitoaika valitaankin monesti kokemuksen ja harkinnan perusteella. Tärkeimmät reunaehdot jakeluverkkokomponenttien teknistaloudellisten pitoaikojen valinnalle muodostavat verkkovastuualueen sähkönkulutuksen kasvun sekä infrastruktuurin muutoksen nopeudet. Hitaan muutoksen alueilla verkkokomponenttien teknistaloudelliset pitoajat lähenevät teknisiä pitoaikoja, joihin vaikuttavat voimakkaasti verkkovastuualueen maantieteelliset ja ilmastolliset ominaispiirteet. Yhtiöittäin vaihtelevat verkon rakennus- ja ylläpitomenetelmät tulee myös huomioida. Tässä diplomityössä keskitytään pääosin sähkönjakeluverkon komponenttien teknistaloudelliseen pitoaikaan verkon ja verkkovastuualueen ominaispiirteiden kautta. Aluksi määritellään jakeluverkon pitoaika usealla eri tavalla, sekä selvitetään pitoajan merkitystä nykytilanteessa. Lisäksi työn alkuosassa esitellään Energiamarkkinaviraston vuoden 2005 alusta käyttöönotettu jakeluverkkotoiminnan hinnoittelun kohtuullisuuden valvontamalli ja käydään läpi teknistaloudellisen pitoajan merkitys siinä. Sen jälkeen tarkastellaan jakeluverkkokomponenttien ja niiden osien tekniseen pitoaikaan vaikuttavia tekijöitä. Erityisesti puupylväisiin ja niihin liittyviin ajankohtaisiin asioihin kiinnitetään huomiota, koska puupylväät määräävät monesti koko ilmajohtorakenteen uusimisajankohdan. Lisäksi suolakyllästeiselle puupylväälle esitetään yleinen rappeutumismalli ja jakelumuuntajan rappeutumistapahtumaa tutkitaan. Lopuksi tarkastellaan Graninge Kainuu Oy:tä jakeluverkonhaltijana sekä määritetään sen verkkovastuualueelle ominaisia komponenttien teknisiä ja teknistaloudellisia pitoaikoja haastattelujen, tuoreimpien lähteiden, tutkimustulosten, vertailun ja harkinnan avulla.
Resumo:
Tässä diplomityössä oli tavoitteena suunnitella ja toteuttaa verkkoliiketoiminnan tehokkuusmittauksen ohjausvaikutusten analysointijärjestelmä. Verkkoliiketoiminta on monopoliasemassa olevaa liiketoimintaa, jossa ei ole kilpailusta johtuvaa pakotetta pitää liiketoimintaa tehokkaana ja hintoja alhaisina. Tämän vuoksi verkkoliiketoiminnan hinnoittelua ja toiminnan tehokkuutta tulee valvoa viranomaisen toimesta. Tehokkuusmittauksessa käytettäväksi menetelmäksi on valittu DEA-menetelmä (Data Envelopment Analysis). Tässä työssä on esitelty DEA-menetelmän teoreettiset perusteet sekä verkkoliiketoiminnan tehokkuusmittauksessa havaitut ongelmat. Näiden perusteella on määritelty analysointijärjestelmältä vaadittavat ominaisuudet sekä kehitetty kyseinen järjestelmä. Tärkeimmiksi järjestelmän ominaisuuksiksi osoittautuivat herkkyysanalyysin tekeminen ja etenkin sitä kautta suoritettava keskeytysten hinnan laskeminen sekä mahdollisuudet painokertoimien rajoittamiselle. Työn loppuosassa on esitelty järjestelmästä saatavia konkreettisia tuloksia, joiden avulla on pyritty havainnollistamaan järjestelmän käyttömahdollisuuksia.