Online content services can greatly benefit from personalisation features that enable delivery of content that is suited to each user's specific interests. This thesis presents a system that applies text analysis and user modeling techniques in an online news service for the purpose of personalisation and user interest analysis. The system creates a detailed thematic profile for each content item and observes user's actions towards content items to learn user's preferences. A handcrafted taxonomy of concepts, or ontology, is used in profile formation to extract relevant concepts from the text. User preference learning is automatic and there is no need for explicit preference settings or ratings from the user. Learned user profiles are segmented into interest groups using clustering techniques with the objective of providing a source of information for the service provider. Some theoretical background for chosen techniques is presented while the main focus is in finding practical solutions to some of the current information needs, which are not optimally served with traditional techniques.


Portable music players have made it possible to listen to a personal collection of music in almost every situation, and they are often used during some activity to provide a stimulating audio environment. Studies have demonstrated the effects of music on the human body and mind, indicating that selecting music according to situation can, besides making the situation more enjoyable, also make humans perform better. For example, music can boost performance during physical exercises, alleviate stress and positively affect learning. We believe that people intuitively select different types of music for different situations. Based on this hypothesis, we propose a portable music player, AndroMedia, designed to provide personalised music recommendations using the user’s current context and listening habits together with other user’s situational listening patterns. We have developed a prototype that consists of a central server and a PDA client. The client uses Bluetooth sensors to acquire context information and logs user interaction to infer implicit user feedback. The user interface also allows the user to give explicit feedback. Large user interface elements facilitate touch-based usage in busy environments. The prototype provides the necessary framework for using the collected information together with other user’s listening history in a context- enhanced collaborative filtering algorithm to generate context-sensitive recommendations. The current implementation is limited to using traditional collaborative filtering algorithms. We outline the techniques required to create context-aware recommendations and present a survey on mobile context-aware music recommenders found in literature. As opposed to the explored systems, AndroMedia utilises other users’ listening habits when suggesting tunes, and does not require any laborious set up processes.


Tutkielmassa kuvataan peliohjelmistojen toimintoja ja rakenteita ohjelmistoteknisestä näkökulmasta. Pelisovelluksen yleiseksi arkkitehtuuriksi kuvataan MVC-arkkitehtuurimalliin perustuva ratkaisu, joka käyttää viestinvälitysjärjestelmää sovelluksen osajärjestelmien väliseen kommunikaatioon. Tutkielmassa esitellään peliohjelmistoissa tarvittavan reaaliaikaisen kolmiulotteisen grafiikan menetelmiä sekä avoimeen lähdekoodiin perustuva Ogre-grafiikkakomponentti. Suunnitteluratkaisujen ja menetelmien toimivuutta testataan suunnittelemalla ja toteuttamalla prototyyppi kehysmäisestä peliohjelmistosta. Tutkielman lopuksi esitetään analyysi peliohjelmistoihin suositeltavista suunnitteluratkaisuista, kuten peliobjektien komponenttiperustaisesta mallinnuksesta. Tutkielman konstruktiivisen osuuden tuloksena syntyi tyypitetty viesti -suunnittelumalliin pohjautuva suunnitteluratkaisu ohjelmiston sisäisen viestinvälityksen toteuttamiseen.


Tutkimuksessa perehdyttiin sisällönhallintajärjestelmän periaatteisiin ja navigaatioon. Perusteita hyödynnettiin käyttäjätutkimuksessa, jonka tavoitteena oli löytää ongelmakohtia sisällönhallintajärjestelmän navigaationrakennusprosessista. Menujen luominen osoittautui tulosten mukaan testikäyttäjille ongelmalliseksi.


Place identification is the methodology of automatically detecting spatial regions or places that are meaningful to a user by analysing her location traces. Following this approach several algorithms have been proposed in the literature. Most of the algorithms perform well on a particular data set with suitable choice of parameter values. However, tuneable parameters make it difficult for an algorithm to generalise to data sets collected from different geographical locations, different periods of time or containing different activities. This thesis compares the generalisation performance of our proposed DPCluster algorithm along with six state-of-the-art place identification algorithms on twelve location data sets collected using Global Positioning System (GPS). Spatial and temporal variations present in the data help us to identify strengths and weaknesses of the place identification algorithms under study. We begin by discussing the notion of a place and its importance in location-aware computing. Next, we discuss different phases of the place identification process found in the literature followed by a thorough description of seven algorithms. After that, we define evaluation metrics and compare generalisation performance of individual place identification algorithms and report the results. The results indicate that the DPCluster algorithm performs superior to all other algorithms in terms of generalisation performance.


Tutkielma käsittelee korkean käytettävyyden klustereita. Tavoitteena on vertailla eri klusteriteknologioiden eroja ja arvioida tulosten perusteella sopivia käyttökohteita eri klusterituotteille. Samoja funktioita tarjoavat eri klusterituotteet asetetaan paremmuusjärjestykseen. Arviointi perustuu erilaisiin määrällisiin arvoihin, kuten solmulaitteiden maksimilukumäärä, sekä laadullisiin arvoihin, kuten käyttöönoton ja hallinnoinnin helppous. Erityisesti tavoitteena on tuoda esille eri tuotteiden vahvuuksia ja heikkouksia. Vertailtavia tuotteita ovat Microsoft Cluster Service (MSCS), TruCluster Server for Tru64 UNIX, Steeleye Lifekeeper for Windows ja Sun Cluster. ACM Computing Classification System (CSS): D.4 OPERATING SYSTEMS (C) D.4.5 Reliability


Delay and disruption tolerant networks (DTNs) are computer networks where round trip delays and error rates are high and disconnections frequent. Examples of these extreme networks are space communications, sensor networks, connecting rural villages to the Internet and even interconnecting commodity portable wireless devices and mobile phones. Basic elements of delay tolerant networks are a store-and-forward message transfer resembling traditional mail delivery, an opportunistic and intermittent routing, and an extensible cross-region resource naming service. Individual nodes of the network take an active part in routing the traffic and provide in-network data storage for application data that flows through the network. Application architecture for delay tolerant networks differs also from those used in traditional networks. It has become feasible to design applications that are network-aware and opportunistic, taking an advantage of different network connection speeds and capabilities. This might change some of the basic paradigms of network application design. DTN protocols will also support in designing applications which depend on processes to be persistent over reboots and power failures. DTN protocols could also be applicable to traditional networks in cases where high tolerance to delays or errors would be desired. It is apparent that challenged networks also challenge the traditional strictly layered model of network application design. This thesis provides an extensive introduction to delay tolerant networking concepts and applications. Most attention is given to challenging problems of routing and application architecture. Finally, future prospects of DTN applications and implementations are envisioned through recent research results and an interview with an active researcher of DTN networks.


Tutkielmassa esitellään idean kontekstin kuvaaminen keinona tehostaa ideoiden välittymistä. Kontekstitieto kuvataan dokumentteihin liittyvänä metatietona, jota hallitaan dokumenteista riippumattomissa metatietokannoissa. Päämääränä pidetään sellaista idean kontekstin kuvausta, joka on riittävän ilmaisuvoimainen, mutta jonka luominen ei aseta järjestelmän käyttäjille ylivoimaista työtaakkaa. Tiedon välittyminen nähdään prosessina, johon perustuen idean konteksti jaetaan tuottokontekstiin, julkaisukontekstiin ja käyttökontekstiin. Tähän jakoon perustuen käsitellään metatiedon muodostaminen ja sisältö yksityiskohtaisesti yksittäisten metatietotietueen attribuuttien tasolla. Kontekstitiedon käyttökohteista tarkastellaan kontekstin visualisointia informaation visualisoinnin tekniikoihin perustuen, idean arvon mittaamista bibliometrisiä menetelmiä kehittämällä ja automaattista ideoiden valintaa tiedon suodatuksen menetelmien ja digitaalisten assistenttien avulla.


Sanakirjat ovat rakenteisia tekstejä. Sana-artikkeleissa on nähtävissä selvästi erotettavissa olevia rakenneosia. Painetun sanakirjan muuntaminen rakenteiseen muotoon ei kuitenkaan ole aivan suoraviivaista. Tässä tutkielmassa kerrotaan sanakirjan rakennekuvauksen määrittelyn ja painetun sanakirjan rakenteistuksen ongelmista. Esimerkkinä käytetään Kotimaisten kielten tutkimuskeskuksessa (Kotus) kirjoitettavan Suomen murteiden sanakirjan (SMS) rakenteistusprojektia ja sen yhteydessä määriteltyä rakennekuvausta. SMS:n rakennekuvausta verrataan kielitieteellisten aineistojen koodaamisessa yleisesti käytetyn Text Encoding Initiative -suosituksen sekä uuden ISO 1951:2007 -sanakirjastandardin määrittelemiin rakennekuvauksiin. Muuntamista testataan käytännössä kirjoittamalla XSL-muunnosskripti, joka muuntaa SMS:n aineiston ISOstandardimuotoon. Muunnosprosessin voi todeta olleen hyödyllinen, koska sen aikana paljastui ongelmia sekä SMS:n rakennekuvauksessa että itse standardin määrittelyssä. Tulosten avulla SMS:n koodausta voidaan kehittää edelleen. Lopuksi tarkastellaan standardien käytöstä yleisesti saatavia hyötyjä ja mahdollisuuksia soveltaa niitä Kotuksen sanakirjatyöhön.


Information retrieval of concise and consistent text passages is called passage retrieval. Passages can be used in an information retrieval system to improve its user interface and performance. In this thesis passage retrieval is compared to other forms of information retrieval. Implementation of passage retrieval as a feature of an information retrieval system is discussed. Various existing passage retrieval methods, their implementation and their efficiency are compared. I evaluated two different implementations of passage retrieval: direct passage retrieval and combined passage retrieval. In comparison combined passage retrieval turned out to be more efficient.


Tosiaikainen tietovarasto on keskitetty tietokantajärjestelmä pehmeitä tosiaikaisia liiketoimintatiedon hallintasovelluksia varten. Näiden sovellusten perusvaatimuksena on tuoreen tiedon jatkuva saatavuus. Työssä käsitellään tosiaikaisen tietovaraston suunnittelua, tietovaraston jatkuvan ylläpidon eri vaiheita sekä näihin vaiheisiin soveltuvia menetelmiä. Tarkoitus on tuoda esiin kompromisseja, joita väistämättä joudutaan tekemään tietovaraston kyselytehokkuuden, viiveen ja jatkuvan saatavuuden välillä. Johtopäätöksenä suositellaan sitä suurempaa varovaisuutta mitä pienempiä viiveitä tavoitellaan. Liiketoimintatiedon hallintasovellusten tosiaikaisuus on ominaisuus, jota käyttäjät tavallisesti haluavat enemmän kuin tarvitsevat. Joissakin tapauksissa tosiaikaisuus on suorastaan haitallista. Mutta jos tosiaikainen tieto on välttämätöntä, samanaikaisia käyttäjiä on paljon, ja tarvittavat tiedot pitää yhdistää useasta lähdejärjestelmästä, niin tosiaikaiselle tietovarastoinnille ei ole kelvollista vaihtoehtoa. Tällöinkin riittää, että jatkuvasti ylläpidetään vain pientä osaa koko tietovarastosta.


