129 resultados para natiivi XML -tietokanta


Universumin ensi hetket ; Heureka juhlii ; Uusia kirjoja ; Kielikellon arkistot auki ; SISu-tietokanta ; Uusi Luonnonvarakeskus ; Suomen Akatemiaa koskeva laki ; Tutkimus ja -innovaationeuvoston arviointi ; Millennium -teknologiapalkinto.


Luettelo Kansalliskirjastossa olevista käsin kirjoitetuista sävelmäkokoelmista ym. nuottikirjoista (ei kattava, ks. myös Viola-tietokanta, sanahaku: arkistoaineisto nuottikirjat)


Data management consists of collecting, storing, and processing the data into the format which provides value-adding information for decision-making process. The development of data management has enabled of designing increasingly effective database management systems to support business needs. Therefore as well as advanced systems are designed for reporting purposes, also operational systems allow reporting and data analyzing. The used research method in the theory part is qualitative research and the research type in the empirical part is case study. Objective of this paper is to examine database management system requirements from reporting managements and data managements perspectives. In the theory part these requirements are identified and the appropriateness of the relational data model is evaluated. In addition key performance indicators applied to the operational monitoring of production are studied. The study has revealed that the appropriate operational key performance indicators of production takes into account time, quality, flexibility and cost aspects. Especially manufacturing efficiency has been highlighted. In this paper, reporting management is defined as a continuous monitoring of given performance measures. According to the literature review, the data management tool should cover performance, usability, reliability, scalability, and data privacy aspects in order to fulfill reporting managements demands. A framework is created for the system development phase based on requirements, and is used in the empirical part of the thesis where such a system is designed and created for reporting management purposes for a company which operates in the manufacturing industry. Relational data modeling and database architectures are utilized when the system is built for relational database platform.


Työssä tarkastellaan Keski-Suomen ELY-keskuksen alueen kaikkien kanta-, seutu- ja yhdysteiden merkittävyyttä tieosittain. Tarkasteltava tieverkko jaettiin kahteen osaan: vähäliikenteisiin ja keskivilkkaisiin teihin. Tien toiminnallinen luokka ei vaikuta jaotteluun. Seutu- ja yhdystieverkon tiejaksot, joiden KVL on alle 500 ajon./vrk, kuuluvat vähäliikenteiseen tieverkkoon ja tiet, joiden KVL on vähintään 500 ajon./vrk, kuuluvat keskivilkkaaseen tieverkkoon. Lisäksi työn alussa päätettiin, että kaikki kantatiet sekä kuntakeskuksien väliset seututiet sisällytetään keskivilkkaaseen tieverkkoon, vaikka asetettu liikennemääräraja ei täyttyisi. Tarkasteltavan tieverkon kokonaispituudeksi muotoutui näin ollen 4 660 kilometriä. Merkitsevyysluokitus jakaantuu kolmeen pääluokkaan ja niihin sisältyviin yksittäisiin merkitsevyystekijöihin. Pääluokka 1 sisältää säännöllisen henkilöliikenteen, pääluokka 2 säännöllisen tavaraliikenteen ja pääluokka 3 muita tekijöitä. Koska vähäliikenteinen ja keskivilkas tieverkko eroavat merkityksellisesti ja liikenteellisesti toisistaan, laadittiin niille kunkin pääluokan osalta omat erilliset merkitsevyystekijänsä. Pääpiirteissään luokitus on molemmilla samansuuntainen, mutta eroja syntyy merkitsevyystekijöiden erilaisista painotuksista ja pääluokkien alla tarkasteltavista merkitsevyystekijöistä. Päätettyjen merkitsevyysluokkien, niiden pisteiden ja painoarvojen perusteella kullekin tieosuudelle laskettiin merkitsevyyspisteiden summa. Merkitsevyyspisteiden perusteella tieosat jaettiin neljään eri luokkaan, joista luokka 1 on merkittävin ja luokka 4 vähiten merkittävä. Merkitsevyysluokitukset toimivat apuna niin sanotun alemman tieverkon hankkeiden priorisoinnissa ja tienpidon ohjelmoinnissa. Työssä laaditun tietokannan avulla voidaan tehdä lisäanalyysejä esimerkiksi silloin, kun halutaan asettaa tiet parantamisen osalta kiireellisyysjärjestykseen. Merkitsevyysluokituksia voidaan hyödyntää esimerkiksi hoito- ja soratieluokituksissa, päällystettyjen teiden ylläpitoluokituksessa, rakenteen parantamishankkeiden priorisoinnissa, täsmähoitokohteita määritettäessä ja tien hallinnollisen luokituksen muutoksissa. Merkitsevyysluokitukset toimivat myös apuvälineenä sidosryhmien, kuten esimerkiksi maakuntaliittojen ja kuntien, kanssa käytävässä vuoropuhelussa. Tietokantaan on rakennettu myös herkkyystarkasteluosio. Muuttamalla minkä tahansa merkitsevyystekijän pistearvoa tai pääluokkien painotusta, muuttaa tietokanta jokaisen tieosan sijoitusta automaattisesti. Uusi sija samoin kuin sijamuutos näkyvät alkuperäisen sijoituksen vieressä, jolloin jokaisen tietokantaa käyttävän on helppo ja havainnollista tehdä haluamiaan herkkyystarkasteluja. Herkkyystarkastelun avulla voi myös reaaliajassa nähdä pisteytyksessä tapahtuvan muutoksen vaikutuksen luokituksen jakaumaan. Työkalu laskee automaattisesti luokituksen ja näyttää merkitsevyysluokkien kilometri- ja tieosajakauman.


The emerging technologies have recently challenged the libraries to reconsider their role as a mere mediator between the collections, researchers, and wider audiences (Sula, 2013), and libraries, especially the nationwide institutions like national libraries, haven’t always managed to face the challenge (Nygren et al., 2014). In the Digitization Project of Kindred Languages, the National Library of Finland has become a node that connects the partners to interplay and work for shared goals and objectives. In this paper, I will be drawing a picture of the crowdsourcing methods that have been established during the project to support both linguistic research and lingual diversity. The National Library of Finland has been executing the Digitization Project of Kindred Languages since 2012. The project seeks to digitize and publish approximately 1,200 monograph titles and more than 100 newspapers titles in various, and in some cases endangered Uralic languages. Once the digitization has been completed in 2015, the Fenno-Ugrica online collection will consist of 110,000 monograph pages and around 90,000 newspaper pages to which all users will have open access regardless of their place of residence. The majority of the digitized literature was originally published in the 1920s and 1930s in the Soviet Union, and it was the genesis and consolidation period of literary languages. This was the era when many Uralic languages were converted into media of popular education, enlightenment, and dissemination of information pertinent to the developing political agenda of the Soviet state. The ‘deluge’ of popular literature in the 1920s to 1930s suddenly challenged the lexical orthographic norms of the limited ecclesiastical publications from the 1880s onward. Newspapers were now written in orthographies and in word forms that the locals would understand. Textbooks were written to address the separate needs of both adults and children. New concepts were introduced in the language. This was the beginning of a renaissance and period of enlightenment (Rueter, 2013). The linguistically oriented population can also find writings to their delight, especially lexical items specific to a given publication, and orthographically documented specifics of phonetics. The project is financially supported by the Kone Foundation in Helsinki and is part of the Foundation’s Language Programme. One of the key objectives of the Kone Foundation Language Programme is to support a culture of openness and interaction in linguistic research, but also to promote citizen science as a tool for the participation of the language community in research. In addition to sharing this aspiration, our objective within the Language Programme is to make sure that old and new corpora in Uralic languages are made available for the open and interactive use of the academic community as well as the language societies. Wordlists are available in 17 languages, but without tokenization, lemmatization, and so on. This approach was verified with the scholars, and we consider the wordlists as raw data for linguists. Our data is used for creating the morphological analyzers and online dictionaries at the Helsinki and Tromsø Universities, for instance. In order to reach the targets, we will produce not only the digitized materials but also their development tools for supporting linguistic research and citizen science. The Digitization Project of Kindred Languages is thus linked with the research of language technology. The mission is to improve the usage and usability of digitized content. During the project, we have advanced methods that will refine the raw data for further use, especially in the linguistic research. How does the library meet the objectives, which appears to be beyond its traditional playground? The written materials from this period are a gold mine, so how could we retrieve these hidden treasures of languages out of the stack that contains more than 200,000 pages of literature in various Uralic languages? The problem is that the machined-encoded text (OCR) contains often too many mistakes to be used as such in research. The mistakes in OCRed texts must be corrected. For enhancing the OCRed texts, the National Library of Finland developed an open-source code OCR editor that enabled the editing of machine-encoded text for the benefit of linguistic research. This tool was necessary to implement, since these rare and peripheral prints did often include already perished characters, which are sadly neglected by the modern OCR software developers, but belong to the historical context of kindred languages and thus are an essential part of the linguistic heritage (van Hemel, 2014). Our crowdsourcing tool application is essentially an editor of Alto XML format. It consists of a back-end for managing users, permissions, and files, communicating through a REST API with a front-end interface—that is, the actual editor for correcting the OCRed text. The enhanced XML files can be retrieved from the Fenno-Ugrica collection for further purposes. Could the crowd do this work to support the academic research? The challenge in crowdsourcing lies in its nature. The targets in the traditional crowdsourcing have often been split into several microtasks that do not require any special skills from the anonymous people, a faceless crowd. This way of crowdsourcing may produce quantitative results, but from the research’s point of view, there is a danger that the needs of linguists are not necessarily met. Also, the remarkable downside is the lack of shared goal or the social affinity. There is no reward in the traditional methods of crowdsourcing (de Boer et al., 2012). Also, there has been criticism that digital humanities makes the humanities too data-driven and oriented towards quantitative methods, losing the values of critical qualitative methods (Fish, 2012). And on top of that, the downsides of the traditional crowdsourcing become more imminent when you leave the Anglophone world. Our potential crowd is geographically scattered in Russia. This crowd is linguistically heterogeneous, speaking 17 different languages. In many cases languages are close to extinction or longing for language revitalization, and the native speakers do not always have Internet access, so an open call for crowdsourcing would not have produced appeasing results for linguists. Thus, one has to identify carefully the potential niches to complete the needed tasks. When using the help of a crowd in a project that is aiming to support both linguistic research and survival of endangered languages, the approach has to be a different one. In nichesourcing, the tasks are distributed amongst a small crowd of citizen scientists (communities). Although communities provide smaller pools to draw resources, their specific richness in skill is suited for complex tasks with high-quality product expectations found in nichesourcing. Communities have a purpose and identity, and their regular interaction engenders social trust and reputation. These communities can correspond to research more precisely (de Boer et al., 2012). Instead of repetitive and rather trivial tasks, we are trying to utilize the knowledge and skills of citizen scientists to provide qualitative results. In nichesourcing, we hand in such assignments that would precisely fill the gaps in linguistic research. A typical task would be editing and collecting the words in such fields of vocabularies where the researchers do require more information. For instance, there is lack of Hill Mari words and terminology in anatomy. We have digitized the books in medicine, and we could try to track the words related to human organs by assigning the citizen scientists to edit and collect words with the OCR editor. From the nichesourcing’s perspective, it is essential that altruism play a central role when the language communities are involved. In nichesourcing, our goal is to reach a certain level of interplay, where the language communities would benefit from the results. For instance, the corrected words in Ingrian will be added to an online dictionary, which is made freely available for the public, so the society can benefit, too. This objective of interplay can be understood as an aspiration to support the endangered languages and the maintenance of lingual diversity, but also as a servant of ‘two masters’: research and society.


Yli puolet kuntien vuosibudjeteista kuluu sosiaali- ja terveyspalveluihin. Jatkossa väestö ikääntyy ja huoltosuhteen muutos tulee niukentamaan kuntien resursseja ja lisäämään palvelujen tarvetta. Näin ollen vaikuttavien ja kustannustehokkaiden ratkaisumallien luominen on ensiarvoisen tärkeää. Tutkimuksen tavoitteena on rakentaa malli, jota voidaan hyödyntää tuottavuuden, vaikuttavuuden ja kustannusvaikuttavuuden jatkuvassa seurannassa alueellisissa sosiaali- ja terveyspalveluissa ja testata mallia esimerkkitapauksilla. Pääpaino on vaikuttavuudessa ja kustannusvaikuttavuudessa. Aiemman tutkimuksen perusteella tuottavuuden, vaikuttavuuden ja kustannusvaikuttavuuden mittaamiseen on useita lähestymistapoja. Tässä tutkimuksessa tuottavuutta arvioidaan panosten ja tuotosten suhteella, vaikuttavuutta palvelujen käytöllä ja kustannusvaikuttavuutta palvelujen käytön kustannuksilla. Kirjallisuudesta nousee esille selkeä tarve yli perinteisten organisaatiorajojen menevälle jatkuvalle vaikuttavuuden seurannalle. Aikaisempi tutkimus kattaa kertaluontoisia selvityksiä, joissa usein mittarit ovat operatiivisella tasolla, toimialasidonnaisia tai vaikeasti mitattavissa. Tutkimus on suunnittelutiedettä. Tutkimuksen lopputuloksena syntyy sosiaali- ja terveyspalvelujen käyttömalli (sote-palvelujen käyttömalli), jota varten toteutetaan tietokanta ja raportointikerros. Sote-palvelujen käyttömallia testataan tässä tutkimuksessa kolmella eri organisaatioyksiköllä ja asiakasryhmällä, jotka ovat strategisesti merkittäviä tutkittavalle organisaatiolle ja asiakasryhmiin on kohdennettu selkeä kehittämistoimenpide (kuntoutukseen panostaminen ja vammaisten sekä vanhusten laitoshoidon purku). Sote-palvelujen käyttömalli tuottaa tietoa kehittämistoimenpiteiden tuottavuudesta, vaikuttavuudesta ja kustannusvaikuttavuudesta. Sote-palvelujen käyttömallin todetaan soveltuvan tutkittavaan organisaatioon ja sote-palvelujen käyttömalli on sielläjatkuvassa käytössä. Sote-palvelujen käyttömalli on siirrettävissä myös muihin soteorganisaatioihin ja laajennettavissa myös muihin sosiaali- ja terveyspalveluihin ja niitä lähellä oleviin palveluihin.


The lack of research of private real estate is a well-known problem. Earlier studies have mostly concentrated on the USA or the UK. Therefore, this master thesis offers more information about the performance and risk associated with private real estate investments in Nordic countries, but especially in Finland. The structure of this master thesis is divided into two independent sections based on the research questions. In first section, database analysis is performed to assess risk-return ratio of direct real estate investment for Nordic countries. Risk-return ratios are also assessed for different property sectors and economic regions. Finally, review of diversification strategies based on property sectors and economic regions is performed. However, standard deviation itself is not usually sufficient method to evaluate riskiness of private real estate. There is demand for more explicit assessment of property risk. One solution is property risk scoring. In second section risk scorecard based tool is built to make different real estate comparable in terms of risk. In order to do this, nine real estate professionals were interviewed to enhance the structure of theory-based risk scorecard and to assess weights for different risk factors.


Selvityksessä priorisoitiin Keski-Pohjanmaan ja Pohjanmaan maakuntien vähäliikenteistä maantietieverkkoa ja sen hoitoa erityisesti elinkeinoelämän ja tuotannollisen toiminnan tarpeiden näkökulmasta, mutta myös muut näkökulmat huomioiden. Merkitsevyysarviointi toteutettiin paikkatietoihin pohjautuvana tarkasteluna eli poikkileikkauksena arviointihetken tilanteesta. Lähtötiedot pyrittiin etsimään mahdollisimman pitkälle ylläpidettävistä tilastoista, rekistereistä ja paikkatietoaineistoista. Merkitsevyyspisteistä ja priorisoinnista on myös laadittu erillinen excel-tietokanta. Sekä Pohjanmaalla että Keski-Pohjanmaalla vähäliikenteisten teiden osuus koko maakuntien alueen maanteiden pi-tuudesta on noin 50 %. Pohjanmaalla vähäliikenteisten teiden tiepituuden mukaan laskettu jakauma merkitsevyysluok-kiin on lähellä koko Etelä-Pohjanmaan ELY-keskuksen alueen jakaumaa. Keski-Pohjanmaalla taas on suhteessa enemmän luokkaan 1 priorisoitua tietä. Vaikka Keski-Pohjanmaan maantieverkon pituus on pienempi kuin Pohjanmaan, luokkaan 1 priorisoitua tiepituutta on suunnilleen yhtä paljon. Luokkaan 1 luokitellut vähäliikenteiset tiet Pohjanmaalla ja Keski-Pohjanmaalla ovat yhtä lukuun ottamatta päällystettyjä. Päällystetyyppi on pääosin pehmeä asfalttibetoni, joillain lyhyillä osuuksilla on käytetty myös kovaa asfalttibetonia. Luokkaan 1 luokitellut tiet ovat talvihoitoluokaltaan joko II (pääosin lumipintainen) tai III lumipintainen, hiekoitus vain pahimmissa olosuhteissa. Hoitoluokka tieosittain on esitetty taulukossa 3. Luokitustuloksia voidaan hyödyntää esimerkiksi hoitoluokkien päivittämisen ja päällystysohjelman laatimisen yhteydessä.


Tutkielman tarkoituksena on vertailla verkkosivujen grafiikkatyökaluja. Tutkielmassa käsitellään kahta 2D-grafiikkaan liittyvää web-tekniikkaa: SVG:tä ja HTML5:n canvas-elementtiä. Ensin esitellään molemmat teknologiat, sitten käydään läpi molempien käyttöä esimerkkien ja kuvien avulla. Työssä esitetään myös eri tapoja toteuttaa animaatioita. Lopuksi teknologioita ja niiden käyttömahdollisuuksia vertaillaan. Tutkielmassa pyritään vastaamaan seuraaviin kysymyksiin: Mitä ovat SVG ja HTML5:n canvas-elementti? Miten niitä käytetään? Miten ne eroavat toisistaan? Mihin käyttötarkoituksiin ne sopivat? SVG on skaalautuvan vektorigrafiikan formaatti kaksiulotteisen grafiikan esittämiseen. SVG perustuu vektoreihin ja se kuvataan XML-tyylisellä kielellä. SVG soveltuu tilanteisiin, joissa kuviota halutaan suurentaa ja pienentää laadun kärsimättä. HTML5:n uutuus canvas-elementti luo verkkosivulle piirtoalustan, johon voidaan piirtää JavaScriptillä Canvas API:n kautta. Canvas-alustalle piirretyt kuvat perustuvat bittikarttaan, joten teknologia soveltuu parhaiten pikseleiden tasolla tehtyihin operaatioihin ja esimerkiksi web-ohjelmien toteuttamiseen.