Kalman Filter Algorithm for Rating and Prediction in Basketball


Autoria(s): Poropudas, Jirka
Contribuinte(s)

Helsingin yliopisto, valtiotieteellinen tiedekunta, Sosiaalitieteiden laitos, Tilastotiede

Data(s)

15/06/2011

Resumo

The Thesis presents a state-space model for a basketball league and a Kalman filter algorithm for the estimation of the state of the league. In the state-space model, each of the basketball teams is associated with a rating that represents its strength compared to the other teams. The ratings are assumed to evolve in time following a stochastic process with independent Gaussian increments. The estimation of the team ratings is based on the observed game scores that are assumed to depend linearly on the true strengths of the teams and independent Gaussian noise. The team ratings are estimated using a recursive Kalman filter algorithm that produces least squares optimal estimates for the team strengths and predictions for the scores of the future games. Additionally, if the Gaussianity assumption holds, the predictions given by the Kalman filter maximize the likelihood of the observed scores. The team ratings allow probabilistic inference about the ranking of the teams and their relative strengths as well as about the teams’ winning probabilities in future games. The predictions about the winners of the games are correct 65-70% of the time. The team ratings explain 16% of the random variation observed in the game scores. Furthermore, the winning probabilities given by the model are concurrent with the observed scores. The state-space model includes four independent parameters that involve the variances of noise terms and the home court advantage observed in the scores. The Thesis presents the estimation of these parameters using the maximum likelihood method as well as using other techniques. The Thesis also gives various example analyses related to the American professional basketball league, i.e., National Basketball Association (NBA), and regular seasons played in year 2005 through 2010. Additionally, the season 2009-2010 is discussed in full detail, including the playoffs.

Työssä esitellään koripalloliigaa kuvaava diskreettiaikainen tila-avaruusmalli sekä Kalman-suotimeen perustuva algoritmi koripalloliigan tilan estimointiin. Tila-avaruusmallissa jokaisella liigan joukkueella on voimaluku (”rating”), joka kuvastaa joukkueen hyvyyttä suhteessa muihin liigan joukkueisiin. Joukkueiden voimasuhteiden oletetaan kehittyvän stokastisesti ajassa ja niiden muutokset oletetaan normaalijakautuneiksi riippumattomiksi satunnaismuuttujiksi. Joukkueiden voimalukujen estimointi perustuu havaittuihin ottelutuloksiin, joiden oletetaan riippuvan lineaarisesti joukkueiden todellisista voimaluvuista sekä normaalijakautuneesta kohinasta. Joukkueiden voimaluvut estimoidaan rekursiivisella Kalman-suodin algoritmilla, joka tuottaa pienimmän neliösumman mielessä optimaalisia estimaatteja joukkueiden voimaluvuille sekä tuleville ottelutuloksille. Lisäksi normaalijakauma-oletusten pätiessä Kalman-suotimen tuottamat ennusteet maksimoivat havaittujen tulosten uskottavuuden. Voimalukuestimaattien avulla voidaan tehdä päätelmiä joukkueiden paremmuusjärjestyksestä ja niiden välisistä tasoeroista sekä ennustaa voitontodennäköisyyksiä tulevissa otteluissa. Mallin ennusteet otteluiden voittajista osuvat oikein 65-70%:sti. Mallin avulla pystytään selittämään noin 16% ottelutulosten satunnaisesta vaihtelusta. Lisäksi mallin tuottamat arviot joukkueiden voitontodennäköisyyksistä ovat sopusoinnussa havaittujen ottelutulosten kanssa. Tila-avaruusmallissa on neljä riippumatonta parametria, jotka kuvaavat erilaisten kohinatermien varianssia sekä ottelutuloksien sisältämää kotietua. Työssä esitellään näiden parametrien estimointi sekä suurimman uskottavuuden menetelmällä että hyödyntäen muita keinoja. Työ tarjoaa myös lukuisia esimerkkianalyyseja, joissa tarkastellaan amerikkalaisen ammattilaiskoripallosarjan NBA:n (National Basketball Association) runkosarjan ottelutuloksia vuosina 2005-2010. Lisäksi esitetään kauden 2009-2010 yksityiskohtaisempi tarkastelu, mukaan lukien pudotuspelit.

Identificador

http://hdl.handle.net/10138/26615

Idioma(s)

en

Palavras-Chave #Tilastotiede
Tipo

Thesis

Pro gradu -työ

text