36 resultados para Hermite-cosh-Gaussian beams
Resumo:
Speaker diarization is the process of sorting speeches according to the speaker. Diarization helps to search and retrieve what a certain speaker uttered in a meeting. Applications of diarization systemsextend to other domains than meetings, for example, lectures, telephone, television, and radio. Besides, diarization enhances the performance of several speech technologies such as speaker recognition, automatic transcription, and speaker tracking. Methodologies previously used in developing diarization systems are discussed. Prior results and techniques are studied and compared. Methods such as Hidden Markov Models and Gaussian Mixture Models that are used in speaker recognition and other speech technologies are also used in speaker diarization. The objective of this thesis is to develop a speaker diarization system in meeting domain. Experimental part of this work indicates that zero-crossing rate can be used effectively in breaking down the audio stream into segments, and adaptive Gaussian Models fit adequately short audio segments. Results show that 35 Gaussian Models and one second as average length of each segment are optimum values to build a diarization system for the tested data. Uniting the segments which are uttered by same speaker is done in a bottom-up clustering by a newapproach of categorizing the mixture weights.
Resumo:
This PhD thesis in Mathematics belongs to the field of Geometric Function Theory. The thesis consists of four original papers. The topic studied deals with quasiconformal mappings and their distortion theory in Euclidean n-dimensional spaces. This theory has its roots in the pioneering papers of F. W. Gehring and J. Väisälä published in the early 1960’s and it has been studied by many mathematicians thereafter. In the first paper we refine the known bounds for the so-called Mori constant and also estimate the distortion in the hyperbolic metric. The second paper deals with radial functions which are simple examples of quasiconformal mappings. These radial functions lead us to the study of the so-called p-angular distance which has been studied recently e.g. by L. Maligranda and S. Dragomir. In the third paper we study a class of functions of a real variable studied by P. Lindqvist in an influential paper. This leads one to study parametrized analogues of classical trigonometric and hyperbolic functions which for the parameter value p = 2 coincide with the classical functions. Gaussian hypergeometric functions have an important role in the study of these special functions. Several new inequalities and identities involving p-analogues of these functions are also given. In the fourth paper we study the generalized complete elliptic integrals, modular functions and some related functions. We find the upper and lower bounds of these functions, and those bounds are given in a simple form. This theory has a long history which goes back two centuries and includes names such as A. M. Legendre, C. Jacobi, C. F. Gauss. Modular functions also occur in the study of quasiconformal mappings. Conformal invariants, such as the modulus of a curve family, are often applied in quasiconformal mapping theory. The invariants can be sometimes expressed in terms of special conformal mappings. This fact explains why special functions often occur in this theory.
Resumo:
Mathematical models often contain parameters that need to be calibrated from measured data. The emergence of efficient Markov Chain Monte Carlo (MCMC) methods has made the Bayesian approach a standard tool in quantifying the uncertainty in the parameters. With MCMC, the parameter estimation problem can be solved in a fully statistical manner, and the whole distribution of the parameters can be explored, instead of obtaining point estimates and using, e.g., Gaussian approximations. In this thesis, MCMC methods are applied to parameter estimation problems in chemical reaction engineering, population ecology, and climate modeling. Motivated by the climate model experiments, the methods are developed further to make them more suitable for problems where the model is computationally intensive. After the parameters are estimated, one can start to use the model for various tasks. Two such tasks are studied in this thesis: optimal design of experiments, where the task is to design the next measurements so that the parameter uncertainty is minimized, and model-based optimization, where a model-based quantity, such as the product yield in a chemical reaction model, is optimized. In this thesis, novel ways to perform these tasks are developed, based on the output of MCMC parameter estimation. A separate topic is dynamical state estimation, where the task is to estimate the dynamically changing model state, instead of static parameters. For example, in numerical weather prediction, an estimate of the state of the atmosphere must constantly be updated based on the recently obtained measurements. In this thesis, a novel hybrid state estimation method is developed, which combines elements from deterministic and random sampling methods.
Resumo:
In any decision making under uncertainties, the goal is mostly to minimize the expected cost. The minimization of cost under uncertainties is usually done by optimization. For simple models, the optimization can easily be done using deterministic methods.However, many models practically contain some complex and varying parameters that can not easily be taken into account using usual deterministic methods of optimization. Thus, it is very important to look for other methods that can be used to get insight into such models. MCMC method is one of the practical methods that can be used for optimization of stochastic models under uncertainty. This method is based on simulation that provides a general methodology which can be applied in nonlinear and non-Gaussian state models. MCMC method is very important for practical applications because it is a uni ed estimation procedure which simultaneously estimates both parameters and state variables. MCMC computes the distribution of the state variables and parameters of the given data measurements. MCMC method is faster in terms of computing time when compared to other optimization methods. This thesis discusses the use of Markov chain Monte Carlo (MCMC) methods for optimization of Stochastic models under uncertainties .The thesis begins with a short discussion about Bayesian Inference, MCMC and Stochastic optimization methods. Then an example is given of how MCMC can be applied for maximizing production at a minimum cost in a chemical reaction process. It is observed that this method performs better in optimizing the given cost function with a very high certainty.
Resumo:
Diplomityössä tavoitteena oli suunnitella kantava modulaarinen kehikkorakenne, joka soveltuu käytettäväksi erilaisissa tasoratkaisuissa. Suunnittelumetodina käytettiin järjestelmällistä tuotesuunnittelua. Rakenteen tuli olla modulaarinen, valmistettavissa laserleikkaamalla ja toteutettu ruuviliitoksilla. Lisäksi kehikkorakenteen suunnittelussa pyrittiin optimaalisimpaan ratkaisuun niin teknisen kuin taloudellisenkin toteutuksen kannalta. Premekon Oy investoi vuonna 2009 laserleikkuukeskukseen, jossa pystytään leikkaamaan levyjä ja palkkeja. Yhdessä oikeanlaisen tuotesuunnittelun kanssa laserleikkuukeskuksella pystytään valmistamaan tuotteita suurella tuotantotehokkuudella. Kantavan modulaarisen kehikkorakenteen kehittäminen mahdollisti laserleikkuun aiempaa tehokkaamman hyödyntämisen. Työssä tarkasteltiin yksityiskohtaisemmin erilaisten profiilien soveltuvuutta laserleikattavaksi, osien muotoilua, liitosten yhteensopivuutta ja lujuutta.
Resumo:
This study investigated the surface hardening of steels via experimental tests using a multi-kilowatt fiber laser as the laser source. The influence of laser power and laser power density on the hardening effect was investigated. The microhardness analysis of various laser hardened steels was done. A thermodynamic model was developed to evaluate the thermal process of the surface treatment of a wide thin steel plate with a Gaussian laser beam. The effect of laser linear oscillation hardening (LLOS) of steel was examined. An as-rolled ferritic-pearlitic steel and a tempered martensitic steel with 0.37 wt% C content were hardened under various laser power levels and laser power densities. The optimum power density that produced the maximum hardness was found to be dependent on the laser power. The effect of laser power density on the produced hardness was revealed. The surface hardness, hardened depth and required laser power density were compared between the samples. Fiber laser was briefly compared with high power diode laser in hardening medium-carbon steel. Microhardness (HV0.01) test was done on seven different laser hardened steels, including rolled steel, quenched and tempered steel, soft annealed alloyed steel and conventionally through-hardened steel consisting of different carbon and alloy contents. The surface hardness and hardened depth were compared among the samples. The effect of grain size on surface hardness of ferritic-pearlitic steel and pearlitic-cementite steel was evaluated. In-grain indentation was done to measure the hardness of pearlitic and cementite structures. The macrohardness of the base material was found to be related to the microhardness of the softer phase structure. The measured microhardness values were compared with the conventional macrohardness (HV5) results. A thermodynamic model was developed to calculate the temperature cycle, Ac1 and Ac3 boundaries, homogenization time and cooling rate. The equations were numerically solved with an error of less than 10-8. The temperature distributions for various thicknesses were compared under different laser traverse speed. The lag of the was verified by experiments done on six different steels. The calculated thermal cycle and hardened depth were compared with measured data. Correction coefficients were applied to the model for AISI 4340 steel. AISI 4340 steel was hardened by laser linear oscillation hardening (LLOS). Equations were derived to calculate the overlapped width of adjacent tracks and the number of overlapped scans in the center of the scanned track. The effect of oscillation frequency on the hardened depth was investigated by microscopic evaluation and hardness measurement. The homogeneity of hardness and hardened depth with different processing parameters were investigated. The hardness profiles were compared with the results obtained with conventional single-track hardening. LLOS was proved to be well suitable for surface hardening in a relatively large rectangular area with considerable depth of hardening. Compared with conventional single-track scanning, LLOS produced notably smaller hardened depths while at 40 and 100 Hz LLOS resulted in higher hardness within a depth of about 0.6 mm.
Resumo:
Tässä tutkimuksessa selvitetään ilman hitsauslisäainetta tapahtuvan laser–TIG–hybridihitsausprosessin soveltuvuus 6 mm ja 8 mm paksujen päittäisliitettyjen S355 K2 ja Laser 355 MC rakenneterästen hitsaukseen. Hitsien tarkastelussa huomio kiinnitetään hitsausnopeuteen, hitsien tunkeumaan, liittämistehokkuuteen, hitsien kovuuteen ja hitsausliitoksen ulkonäköön. Muita tutkittavia asioita ovat laser-TIG-hybridihitsattujen levyjen muodonmuutokset ja suuresta hitsausnopeudesta sekä pienestä t8/5 jäähtymisajasta johtuvat mahdolliset kylmähalkeamat. Laser-TIG-hybridihitsejä verrataan robotti-MAG- ja käsin MAG-hitseihin sekä kaarihitsausstandardin SFS-EN ISO 5817 hitsiluokkien mukaisiin raja-arvoihin. Laser-TIG-hybridihitsausprosessissa TIG-valokaari mahdollistaa tasaisen ja lähes roiskeettoman hitsin ja lasersäde aikaansaa syvän tunkeuman sekä tasalaatuisen juurihitsin. Laser-TIG-hybridihitsausprosessilla 6 mm paksut S355 K2 rakenneteräslevyt on mahdollista hitsata levyn yhdeltä puolelta kerralla valmiiksi. Paksummat 8 mm levyt voidaan hitsata levyn yhdeltä tai molemmilta puolilta suoritettavalla laser-TIG-hybridihitsauksella. Laser-TIG-hybridihitsausprosessilla hitsatut hitsit ovat hyvin siistejä ja lähes roiskeettomia. Verrattaessa laser-TIG-hybridihitsausprosessia muihin hitsausprosesseihin sen voidaan todeta olevan erittäin kilpailukykyinen 6 mm paksujen päittäisliitettyjen rakenneterästen hitsaamisessa, mutta se soveltuu myös 8 mm paksujen rakenneterästen hitsaamiseen. Tutkitut hitsit täyttävät kaarihitsausstandardin SFS-EN ISO 5817 B- ja D-hitsiluokkien mukaiset raja-arvot. Vertailukokeet 6 mm paksulla S355 rakenneteräksellä osoittavat, että yhdeltä puolelta suoritettavan laser-TIG-hybridihitsauksen hitsausnopeus on robotti-MAG-hitsaukseen verrattuna yli nelinkertainen ja MAG-käsinhitsaukseen verrattuna yli viisinkertainen. Laser-TIG-hybridihitsauksessa liittämistehokkuus on noin viisinkertainen robotti-MAGhitsaukseen verrattuna. Molemmilta puolilta suoritettavalla laser-TIG-hybridihitsauksella voidaan 8 mm paksulla S355 rakenneteräksellä saavuttaa noin kolminkertainen hitsausnopeus ja liittämistehokkuus robotti-MAG-hitsaukseen verrattuna. Laser-TIG-hybridihitsauksessa TIG-kaaren tuoman lisälämmön ansiosta suurillakin hitsausnopeuksilla (1 m/min) voidaan saavuttaa edulliset kovuusarvot. Kovuusmittausten tulosten perusteella 6 mm ja 8 mm paksujen S355 K2 ja Laser 355 MC rakenneterästen hitsit eivät ylittäneet kaarihitsausstandardin määrittelemää 350 HV kovuuden enimmäisrajaa. Laser-TIG-hybridihitsauksen edullisesta lämmöntuonnista johtuen levyjen pituus- ja poikittaissuuntaiset muodonmuutokset ovat noin 80 prosenttia pienemmät kuin käsin suoritettavassa MAG-hitsauksessa. Laser-TIG-hybridihitsausprosessilla käytetään I-railoa, mutta robotti-MAG- ja käsin MAG-hitsausprosesseilla joudutaan käyttämään V-railoa, jolloin lämmöntuonti ja siitä johtuvat muodonmuutokset ovat suuremmat. Korkea liittämistehokkuus ja edullinen lämmöntuonti merkitsevät vähäisempiä muodonmuutoksia ja siten merkittäviä säästöjä työ-, materiaali- ja energiakustannuksissa. 8 mm ja sitä paksummilla S355 rakenneteräksillä levyn yhdeltä puolelta suoritettava päittäisliitoksen hitsaaminen on laser-TIG hybridihitsauksella haastavaa, koska yli 200 A:n TIG-kaarivirralla suuri metallisula aiheuttaa avaimenreiän sulkeutumisen ja avaimenreiän alaosaan muodostuu kaasukuplia. Tästä voidaan tehdä sellainen johtopäätös, että päittäisliitettävien levyjen ilmarakoa pitäisi kasvattaa niin suureksi, että avaimenreiän sulavirtaus ei pääse estymään. Yli 0,25 mm:n ilmarako edellyttää lasersäteen vaaputusta tai säteen halkaisijan kasvattamista. Ilmaraon kasvattaminen edellyttää myös lisäaineen käyttöä. Tutkimustulosten perusteella laser-TIG-hybridihitsausprosessilla voidaan saavuttaa merkittäviä etuja ja kustannussäästöjä, joten sen hyödyntämistä kannattaa harkita 8 mm ja sitä ohuempien päittäisliitettävien tuotteiden konepaja- ja tehdastuotannossa. Laser-TIGhybridihitsausprosessi soveltuu esimerkiksi seuraavien tuotteiden hitsaamiseen: päittäisliitettävät levyt, palkit, koneenosat, putket, säiliöt ja erilaiset pyörähdyskappaleet.
Resumo:
JÄKÄLA-algoritmi (Jatkuvan Äänitehojakautuman algoritmi Käytävien Äänikenttien LAskentaan) ja sen NUMO- ja APPRO-laskentayhtälöt perustuvat käytävällä olevan todellisen äänilähteen kuvalähteiden symmetriaan. NUMO on algoritmin numeerisen ratkaisun ja APPRO likiarvoratkaisun laskentayhtälö. Algoritmia johdettaessa oletettiin, että absorptiomateriaali oli jakautunut tasaisesti käytävän ääntä heijastaville pinnoille. Suorakaiteen muotoisen käytävän kuvalähdetason muunto jatkuvaksi äänitehojakautumaksi sisältää kolme muokkausvaihetta. Aluksi suorakaiteen kuvalähdetaso muunnetaan neliön muotoiseksi. Seuraavaksi neliön muotoisen kuvalähdetason samanarvoiset kuvalähteet siirretään koordinaattiakselille diskreetiksi kuvalähdejonoksi. Lopuksi kuvalähdejono muunnetaan jatkuvaksi äänitehojakautumaksi, jolloin käytävän vastaanottopisteen äänenpainetaso voidaan laskea integroimalla jatkuvan äänitehojakautuman yli. JÄKÄLA-algoritmin validiteetin toteamiseksi käytettiin testattua kaupallista AKURI-ohjelmaa. AKURI-ohjelma antoi myös hyvän käsityksen siitä, miten NUMO- ja APPRO-yhtälöillä lasketut arvot mahdollisesti eroavat todellisilla käytävillä mitatuista arvoista. JÄKÄLA-algoritmin NUMO- ja APPRO-yhtälöitä testattiin myös vertaamalla niiden antamia tuloksia kolmen erityyppisen käytävän äänenpainetasomittauksiin. Tässä tutkimuksessa on osoitettu, että akustisen kuvateorian pohjalta on mahdollista johtaa laskenta-algoritmi, jota voidaan soveltaa pitkien käytävien äänikenttien pika-arvioinnissa paikan päällä. Sekä teoreettinen laskenta että käytännön äänenpainetasomittaukset todellisilla käytävillä osoittivat, että JÄKÄLA-algoritmin yhtälöiden ennustustarkkuus oli erinomainen ideaalikäytävillä ja hyvä niillä todellisilla käytävillä, joilla ei ollut ääntä heijastavia rakenteita. NUMO- ja APPRO-yhtälöt näyttäisivät toimivan hyvin käytävillä, joiden poikkileikkaus oli lähes neliön muotoinen ja joissa pintojen suurin absorptiokerroin oli korkeintaan kymmenen kertaa pienintä absorptiokerrointa suurempi. NUMO- ja APPRO-yhtälöiden suurin puute on, etteivät ne ota huomioon pintojen erilaisia absorptiokertoimia eivätkä esineistä heijastuvia ääniä. NUMO- ja APPRO- laskentayhtälöt poikkesivat mitatuista arvoista eniten käytävillä, joilla kahden vastakkaisen pinnan absorptiokerroin oli hyvin suuri ja toisen pintaparin hyvin pieni, ja käytävillä, joissa oli massiivisia, ääntä heijastavia pilareita ja palkkeja. JÄKÄLA-algoritmin NUMO- ja APPRO-yhtälöt antoivat tutkituilla käytävillä kuitenkin selvästi tarkempia arvoja kuin Kuttruffin likiarvoyhtälö ja tilastollisen huoneakustiikan perusyhtälö. JÄKÄLA-algoritmin laskentatarkkuutta on testattu vain neljällä todellisella käytävällä. Algoritmin kehittämiseksi tulisi jatkossa käytävän vastakkaisia pintoja ja niiden absorptiokertoimia käsitellä laskennassa pareittain. Algoritmin validiteetin varmistamiseksi on mittauksia tehtävä lisää käytävillä, joiden absorptiomateriaalien jakautumat poikkeavat toisistaan.
Resumo:
The capacity of beams is a very important factor in the study of durability of structures and structural members. The capacity of a high-strength steel I-beam made of S960 QC was investigated in this study. The investigation included assessment of the service limits and ultimate limits of the steel beam. The thesis was done according to European standards for steel structures, Eurocode 3. An analytical method was used to determine the throat thickness, deformation, elastic and plastic moment capacities as well as the fatigue life of the beam. The results of the analytical method were compared with those obtained by Finite Element Analysis (FEA). Elastic moment capacity obtained by the analytical method was 172 kNm. FEA and the analytical method predicted the maximum lateral-torsional buckling (LTB) capacity in the range of 90-93 kNm and the probability of failure as a result of LTB is estimated to be 50%. The lateral buckling capacity meant that the I-beam can carry a safe load of 300 kN instead of the initial load of 600 kN. The beam is liable to fail shortly after exceeding the elastic moment capacity. Based on results in of the different approaches, it was noted that FEA predicted higher deformation values on the load-deformation curve than the analytical results. However, both FEA and the analytical methods predicted identical results for nominal stress range and moment capacities. Fatigue life was estimated to be in the range of 53000-64000 cycles for bending stress range using crack propagation equation and strength-life approach. As Eurocode 3 is limited to steel grades up to S690, results for S960 must be verified with experimental data and appropriate design rules.
Resumo:
Hihnakuljettimia käytetään muun muassa voimalaitos- ja sellutehdasympäristöissä kuljettamaan kiinteää polttoainetta tai haketta pitkiä matkoja. Pitkät hihnakuljettimet asennetaan yleensä teräsristikoista rakennettujen kuljetinsiltojen sisään. Kuljetinsilta toimii siis hihnakuljettimen ja hoitokäytävän runkona sekä suojaa kuljetinta ja kuljetettavaa materiaalia säältä. Tässä diplomityössä on laadittu mitoitustyökalu, jolla voidaan nopeasti mitoittaa ristikkorakenteisen hihnakuljetinsillan sauvat sekä määrittää rakenteen massa. Laskentaohjelma on toteutettu Microsoft Excel -taulukkolaskentana. Sillan poikkileikkaus voi olla suljettu symmetrinen umpirakenne tai avorakenne, jossa on ulokkeellinen hoitotaso. Ristikon sauvat ovat RHS-putkia. Rakenteeseen voi vaikuttaa jatkuvia kuormia, pistekuormia sekä näistä johdetut, ekvivalenttiin staattiseen voimaan perustuvat maanjäristyskuormat. Diplomityössä on perehdytty mitoitustyökalussa sovellettuihin teorioihin. Voimasuureiden laskenta perustuu 2-tukisina palkkeina käsiteltävien siltalohkojen ratkaisuun ja palkkianalogiaan, jossa ristikon sauvavoimat ratkaistaan käsittelemällä ristikkoa palkkina. Sauvojen kestävyyden laskenta perustuu SFS-EN 1993-1-1 -normiin, joka on osa Eurocode -rakennesuunnittelunormistoa. Lisäksi työssä on käsitelty ristikkoliitosten mitoitusta SFS-EN 1993-1-8 mukaan. Mitoitusohjelman toimivuutta on testattu tarkastelemalla esimerkkisiltaa laaditulla mitoituspohjalla ja Autodesk Robot Professional 2013 -FE-analyysiohjelmisuolla. Tulosten perusteella mitoitustyökalua voidaan käyttää ainakin tarjousvaiheen nopeisiin tarkasteluihin ja omamassan määritykseen, mutta myös lopulliseen mitoitukseen, mikäli hyväksytään konservatiivinen mitoitus.
Resumo:
Tässä kandidaatintyössä vertailtiin SolidWorks Simulations ja Femap FE-analyysiohjelmien tuottamia tuloksia. Vertailu suoritettiin yksinkertaisten RHS-putkipalkkien mallinnuksen avulla. Mallinnuksessa käytettiin viittä erilaista kuormitustapausta, jotka sisälsivät mm. taivutus-, vääntö- ja jännityskeskittymätarkastelut. Ohjelmien tuottamia tuloksia verrattiin mahdollisuuksien mukaan analyyttisin menetelmin tehtyihin vertailulaskelmiin. Työn tarkoituksena oli selvittää tuottivatko eri ohjelmat erilaisia tuloksia samoista kuormitustapauksista ja kuinka paljon tulokset erosivat.
Resumo:
Positron Emission Tomography (PET) using 18F-FDG is playing a vital role in the diagnosis and treatment planning of cancer. However, the most widely used radiotracer, 18F-FDG, is not specific for tumours and can also accumulate in inflammatory lesions as well as normal physiologically active tissues making diagnosis and treatment planning complicated for the physicians. Malignant, inflammatory and normal tissues are known to have different pathways for glucose metabolism which could possibly be evident from different characteristics of the time activity curves from a dynamic PET acquisition protocol. Therefore, we aimed to develop new image analysis methods, for PET scans of the head and neck region, which could differentiate between inflammation, tumour and normal tissues using this functional information within these radiotracer uptake areas. We developed different dynamic features from the time activity curves of voxels in these areas and compared them with the widely used static parameter, SUV, using Gaussian Mixture Model algorithm as well as K-means algorithm in order to assess their effectiveness in discriminating metabolically different areas. Moreover, we also correlated dynamic features with other clinical metrics obtained independently of PET imaging. The results show that some of the developed features can prove to be useful in differentiating tumour tissues from inflammatory regions and some dynamic features also provide positive correlations with clinical metrics. If these proposed methods are further explored then they can prove to be useful in reducing false positive tumour detections and developing real world applications for tumour diagnosis and contouring.
Resumo:
A linear prediction procedure is one of the approved numerical methods of signal processing. In the field of optical spectroscopy it is used mainly for extrapolation known parts of an optical signal in order to obtain a longer one or deduce missing signal samples. The first is needed particularly when narrowing spectral lines for the purpose of spectral information extraction. In the present paper the coherent anti-Stokes Raman scattering (CARS) spectra were under investigation. The spectra were significantly distorted by the presence of nonlinear nonresonant background. In addition, line shapes were far from Gaussian/Lorentz profiles. To overcome these disadvantages the maximum entropy method (MEM) for phase spectrum retrieval was used. The obtained broad MEM spectra were further underwent the linear prediction analysis in order to be narrowed.
Resumo:
The theme of this thesis is context-speci c independence in graphical models. Considering a system of stochastic variables it is often the case that the variables are dependent of each other. This can, for instance, be seen by measuring the covariance between a pair of variables. Using graphical models, it is possible to visualize the dependence structure found in a set of stochastic variables. Using ordinary graphical models, such as Markov networks, Bayesian networks, and Gaussian graphical models, the type of dependencies that can be modeled is limited to marginal and conditional (in)dependencies. The models introduced in this thesis enable the graphical representation of context-speci c independencies, i.e. conditional independencies that hold only in a subset of the outcome space of the conditioning variables. In the articles included in this thesis, we introduce several types of graphical models that can represent context-speci c independencies. Models for both discrete variables and continuous variables are considered. A wide range of properties are examined for the introduced models, including identi ability, robustness, scoring, and optimization. In one article, a predictive classi er which utilizes context-speci c independence models is introduced. This classi er clearly demonstrates the potential bene ts of the introduced models. The purpose of the material included in the thesis prior to the articles is to provide the basic theory needed to understand the articles.
Resumo:
Identification of low-dimensional structures and main sources of variation from multivariate data are fundamental tasks in data analysis. Many methods aimed at these tasks involve solution of an optimization problem. Thus, the objective of this thesis is to develop computationally efficient and theoretically justified methods for solving such problems. Most of the thesis is based on a statistical model, where ridges of the density estimated from the data are considered as relevant features. Finding ridges, that are generalized maxima, necessitates development of advanced optimization methods. An efficient and convergent trust region Newton method for projecting a point onto a ridge of the underlying density is developed for this purpose. The method is utilized in a differential equation-based approach for tracing ridges and computing projection coordinates along them. The density estimation is done nonparametrically by using Gaussian kernels. This allows application of ridge-based methods with only mild assumptions on the underlying structure of the data. The statistical model and the ridge finding methods are adapted to two different applications. The first one is extraction of curvilinear structures from noisy data mixed with background clutter. The second one is a novel nonlinear generalization of principal component analysis (PCA) and its extension to time series data. The methods have a wide range of potential applications, where most of the earlier approaches are inadequate. Examples include identification of faults from seismic data and identification of filaments from cosmological data. Applicability of the nonlinear PCA to climate analysis and reconstruction of periodic patterns from noisy time series data are also demonstrated. Other contributions of the thesis include development of an efficient semidefinite optimization method for embedding graphs into the Euclidean space. The method produces structure-preserving embeddings that maximize interpoint distances. It is primarily developed for dimensionality reduction, but has also potential applications in graph theory and various areas of physics, chemistry and engineering. Asymptotic behaviour of ridges and maxima of Gaussian kernel densities is also investigated when the kernel bandwidth approaches infinity. The results are applied to the nonlinear PCA and to finding significant maxima of such densities, which is a typical problem in visual object tracking.