Joint Regression and Association Models for Repeated Categorical Responses


Autoria(s): Jokinen, Jukka
Contribuinte(s)

Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, matematiikan ja tilastotieteen laitos

Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, matematiska och statistiska institutionen

University of Helsinki, Faculty of Science, Department of Mathematics and Statistics

National Public Health Institute, Department of Vaccines

Data(s)

03/02/2007

Resumo

The focus of this study is on statistical analysis of categorical responses, where the response values are dependent of each other. The most typical example of this kind of dependence is when repeated responses have been obtained from the same study unit. For example, in Paper I, the response of interest is the pneumococcal nasopharengyal carriage (yes/no) on 329 children. For each child, the carriage is measured nine times during the first 18 months of life, and thus repeated respones on each child cannot be assumed independent of each other. In the case of the above example, the interest typically lies in the carriage prevalence, and whether different risk factors affect the prevalence. Regression analysis is the established method for studying the effects of risk factors. In order to make correct inferences from the regression model, the associations between repeated responses need to be taken into account. The analysis of repeated categorical responses typically focus on regression modelling. However, further insights can also be gained by investigating the structure of the association. The central theme in this study is on the development of joint regression and association models. The analysis of repeated, or otherwise clustered, categorical responses is computationally difficult. Likelihood-based inference is often feasible only when the number of repeated responses for each study unit is small. In Paper IV, an algorithm is presented, which substantially facilitates maximum likelihood fitting, especially when the number of repeated responses increase. In addition, a notable result arising from this work is the freely available software for likelihood-based estimation of clustered categorical responses.

Tutkimus käsittelee kategorisen vasteen tilastollista analyysiä tilanteessa, jossa vastearvojen välillä on riippuvuutta. Tyypillisimmillään tällaista riippuvuutta esiintyy silloin, kun samalta tutkimuskohteelta on havaittu vaste useana ajankohtana. Esimerkiksi tämän työn ensimmäisessä artikkelissa tutkimuskohteena on 329 lasta, ja tutkittavana vasteena on pneumokokkibakteerin nielukantajuus (kyllä/ei). Kantajuus on mitattu kultakin lapselta yhdeksän kertaa ensimmäisen 18 ikäkuukauden aikana, jolloin saman lapsen toistuvien mittausten ei voida olettaa olevan riippumattomia toisistaan. Esimerkin kaltaisessa tilanteessa ollaan tyypillisesti kiinnostuneita kantajuuden yleisyydestä, sekä siitä, onko tietyillä riskitekijöillä vaikutusta yleisyyteen. Riskitekijöiden vaikutusta tarkastellaan regressiomallilla. Jotta regressiomallista tehtävät päätelmät eivät olisi virheellisiä, on analyysissä otettava huomioon toistettujen mittausten välinen riipuvuus. Analyysin pääpaino on tavallisesti virheettömässä regressiomallinnuksessa. Kuitenkin vastearvojen välisen riippuvuuden tutkimuksella voidaan saavuttaa arvokasta lisäinformaatiota. Tämän työn keskeisenä teemana on regression ja vastearvojen riippuvuuden samanaikainen tilastollinen mallinnus. Toistetun, tai muuten ryhmitellyn, kategorisen vasteen analyysi on laskennallisesti haastavaa. Uskottavuusperusteinen päättely on tyypillisesti mahdollista vain, jos toistettuja mittauksia on kultakin tutkimuskohteelta vain muutama. Tämän työn neljännessä artikkelissa esitellään laskenta-algoritmi, joka helpottaa huomattavasti suurimman uskottavuuden estimointia, eritoten kun toistojen lukumäärä kasvaa. Olennainen osa tutkimuksen tuloksia on myös vapaasti saatavilla oleva ohjelmisto ryhmitellyn kategorisen vastemuuttujan uskottavuusanalyysiin.

Identificador

URN:ISBN:951-740-678-9

http://hdl.handle.net/10138/21259

Idioma(s)

en

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:951-740-677-0

Helsinki: Edita Prima Oy, 2006, Kansanterveyslaitoksen A-sarja. 0359-3584

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #biometria
Tipo

Väitöskirja (artikkeli)

Doctoral dissertation (article-based)

Doktorsavhandling (sammanläggning)

Text