17 resultados para MCMC algorithms
Resumo:
The increasing performance of computers has made it possible to solve algorithmically problems for which manual and possibly inaccurate methods have been previously used. Nevertheless, one must still pay attention to the performance of an algorithm if huge datasets are used or if the problem iscomputationally difficult. Two geographic problems are studied in the articles included in this thesis. In the first problem the goal is to determine distances from points, called study points, to shorelines in predefined directions. Together with other in-formation, mainly related to wind, these distances can be used to estimate wave exposure at different areas. In the second problem the input consists of a set of sites where water quality observations have been made and of the results of the measurements at the different sites. The goal is to select a subset of the observational sites in such a manner that water quality is still measured in a sufficient accuracy when monitoring at the other sites is stopped to reduce economic cost. Most of the thesis concentrates on the first problem, known as the fetch length problem. The main challenge is that the two-dimensional map is represented as a set of polygons with millions of vertices in total and the distances may also be computed for millions of study points in several directions. Efficient algorithms are developed for the problem, one of them approximate and the others exact except for rounding errors. The solutions also differ in that three of them are targeted for serial operation or for a small number of CPU cores whereas one, together with its further developments, is suitable also for parallel machines such as GPUs.
Resumo:
Tässä tutkielmassa rintasyövän ja ruoansulatuselinten syöpien perheittäistä kertymistä ja perimäosuutta estimoitiin lapsena tai nuorena syövän sairastaneiden suomalaisten perheaineistoissa. Perheet poimittiin siten, että jokaisessa perheessä on vähintään yksi alle 40-vuotiaana diagnosoitu syöpätapaus vuosina 1970-2012. Rintasyöpäaineisto koostui 4921 perheestä, joissa oli kaikkiaan 26 259 henkilöä. Ruoansulatuselinten aineisto puolestaan koostui 3328 perheestä ja 22 441 henkilöstä. Syövän perimäosuuden suhteellista ilmaantuvuutta mallinnettiin hierarkkisella bayesiläisellä Poisson-regressio sekamallilla, jossa sairastumisalttiuden vaihtelu jaettiin ympäristön, perimän ja ylihajonnan komponentteihin. Parametrien yhteisposteriorijakaumaa arvioitiin MCMC-otannan avulla JAGS-ohjelmalla. Lisäksi syöpien kertymistä tarkasteltiin estimoimalla sukulaisuussuhteiden mukaan ositettuja suhteellisia syöpäilmaantuvuuksia. Simulaatiotutkimuksella arvioitiin tilastollisen mallin satunnaiskomponenttien estimoituminen ja tarkasteltiin harhan korjauksen vaikutusta tutkimusasetelmaan. Rintasyöpäaineistossa nuorten syöpäpotilaiden perheenjäsenillä havaittiin 739 syöpää ja perheenjäsenten keskimääräinen syöpäriski oli 81% (95%:n todennäköisyysväli 68-94%) suurempi kuin vastaavalla väestöllä. Rintasyövän perimäosuus oli 26% (0-57%). Ruoansulatuselinten syöpiä havaittiin perheenjäsenillä 574 ja perheenjäsenten syöpäriski oli 60% (48-73%) suurempi kuin väestöllä ja sen perimäosuudeksi estimoitiin 63% (37-88%). Tutkielman tulosten mukaan ympäristötekijöiden merkitys rintasyöpäaineistossa on suuri. Vastaavasti ruoansulatuselinten syövissä ympäristötekijöiden merkitys on pienempi ja perimän osuus selvästi suurempi.