Methods in general model localization


Autoria(s): Räty, Minna
Contribuinte(s)

Helsingin yliopisto, maatalous-metsätieteellinen tiedekunta, metsatieteiden laitos

Helsingfors universitet, agrikultur-forstvetenskapliga fakulteten, institutionen för skogsvetenskaper

University of Helsinki, Faculty of Agriculture and Forestry, Department of Forest Sciences

Data(s)

27/05/2011

Resumo

The aim of this study was to evaluate and test methods which could improve local estimates of a general model fitted to a large area. In the first three studies, the intention was to divide the study area into sub-areas that were as homogeneous as possible according to the residuals of the general model, and in the fourth study, the localization was based on the local neighbourhood. According to spatial autocorrelation (SA), points closer together in space are more likely to be similar than those that are farther apart. Local indicators of SA (LISAs) test the similarity of data clusters. A LISA was calculated for every observation in the dataset, and together with the spatial position and residual of the global model, the data were segmented using two different methods: classification and regression trees (CART) and the multiresolution segmentation algorithm (MS) of the eCognition software. The general model was then re-fitted (localized) to the formed sub-areas. In kriging, the SA is modelled with a variogram, and the spatial correlation is a function of the distance (and direction) between the observation and the point of calculation. A general trend is corrected with the residual information of the neighbourhood, whose size is controlled by the number of the nearest neighbours. Nearness is measured as Euclidian distance. With all methods, the root mean square errors (RMSEs) were lower, but with the methods that segmented the study area, the deviance in single localized RMSEs was wide. Therefore, an element capable of controlling the division or localization should be included in the segmentation-localization process. Kriging, on the other hand, provided stable estimates when the number of neighbours was sufficient (over 30), thus offering the best potential for further studies. Even CART could be combined with kriging or non-parametric methods, such as most similar neighbours (MSN).

Spatiaalisen tilastotieteen keinoin pystytään kalibroimaan yleisten, koko laajan tutkimusalueen kattavien, regressiomallien ennusteita, jolloin saadaan yhä tarkempia paikallisia estimaatteja ja arvioita. Yleisen mallin käytölle on ollut esteenä tämä alueellinen epätarkkuus, mutta jos epätarkkuutta pystytään pienentämään, yleisiä malleja voidaan liittää esim. laajojen metsäalueiden inventointi- ja arviointisysteemeihin. Yleisten mallien etuna on niiden yksinkertaisuus ja helppous käytössä. Väitöskirjassa tarkastelualueena on ollut eteläinen Suomi. Väitöskirjassa on tutkittu ja vertailtu erilaisia menetelmiä, joilla regressiomallin antamia ennusteita voidaan paikallistaa eli lokalisoida. Lokalisoinnissa paikallista harhaa, joka on todellisen mitatun arvon ja mallin antaman ennusteen välinen erotus, pienennetään tai poistetaan alueellisesti kokonaan. Yhteistä menetelmille on, että ne hyödyntävät havaintojen välistä spatiaalista autokorrelaatiota. Spatiaalisen autokorrelaation (SA) perusajatuksena on, että kaksi lähekkäin sijaitsevaa kohdetta ovat todennäköisemmin samankaltaisempia kuin kaksi toisistaan kauempana sijaitsevaa kohdetta ja siksi ympäristön poikkeamia yleisestä keskiarvosta voidaan käyttää naapurin arvioimiseen. Tarkempia estimaatteja voidaan saavuttaa erilaisilla menetelmillä. Osassa menetelmistä tutkimusalue on jaettu pienempiin mahdollisimman yhtenäisiin alueisiin, joille alkuperäinen malli on uudelleen sovittettu eli lokalisoitu, ja toisissa lokalisointi tehdään aina kunkin havainnon lähiympäristön havaintojen, nk. naapuruston, avulla. Kaikilla menetelmillä jäännösvirhe (RMSE) pieneni, mutta niillä menetelmillä, joilla lokalisointiin pyrittiin aluetta jakamalla, lokalisoiduissa RMSE:issä oli suurta vaihtelua. Siksi näihin menetelmiin pitäisi liittää jokin lisämuuttuja, jolla pystyisi kontrolloimaan jakamista ja lokalisointia. Tällöin pystyttäisiin arvioimaan, ovatko tietyt jaot kokonaisuudessaan tai yksittäiset alueet lokalisoinnin kannalta kannattavia. Toisaalta naapurustoa hyödyntävä lokalisointi antoi vakaita ennusteita, kun naapureiden määrä oli riittävä (yli 30). Tämä vaihtoehto tarjoaakin parhaimmat mahdollisuudet jatkotutkimuksille; sillä siihen voidaan yhdistää muita väitöskirjassa käytettyjä menetelmiä tai ei-parametrisiä menetelmiä.

Formato

application/pdf

Identificador

URN:ISBN:978-951-651-326-6

http://hdl.handle.net/10138/26268

Idioma(s)

en

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:978-951-651-325-9

2011, Dissertationes Forestales. 1795-7389

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #metsänarvioimistiede
Tipo

Väitöskirja (artikkeli)

Doctoral dissertation (article-based)

Doktorsavhandling (sammanläggning)

Text