Tietovaraston latausprosessin kehittämisen osittainen automatisointi Microsoft SQL Server 2008 -ympäristössä

Tässä työssä tutkitaan tietovaraston latausprosessin kehittämisen nopeuttamista Mic-rosoft SQL Server 2008 -ympäristössä. Työn teoriaosuudet on tarkoitettu tukemaan sekä työn tutkimus- että käytännönosia. Aiheeseen liittyviä tutkimuksia käytiin läpi parhaiden latausprosessin kehittämiseen kuluvaa aikaa vähentävien tapojen selvittä-miseksi. Nykytutkimus keskittyy valmistajasta riippumattomien mallien kehittämiseen ja valmistajakohtaisen latausprosessin luomiseen näiden mallien pohjalta. Yleinen konsensus parhaan mallin suhteen kuitenkin puuttuu. Aiheeseen liittyvien tutkimusten pohjalta esitetään arkkitehtuuri, joka saattaisi tule-vaisuudessa vähentää latausprosessin kehittämiseen kuluvaa aikaa huomattavasti. Tästä arkkitehtuurista luotiin yksinkertaistettu versio sekä siihen pohjautuva sovellus nopeuttamaan latausprosessin kehittämistä Microsoftin ETL-työkalulla.

This thesis deals with expediting the implementation of data warehouse ETL in Mi-crosoft SQL Server 2008 environment. The theoretical parts of this thesis are there to support the thesis’ research and practical parts. Related research on the subject was explored in order to determine the best methods for decreasing ETL development time. Related research currently focuses on developing vendor-independent models for modeling ETL processes and generating vendor-specific ETL code from these models. However, there is no consensus among different research groups as to what kind of a model would be the best. Based on research of related works, a proposal for an architecture is presented. The architecture could be used to considerably decrease ETL development time in the future. A simplified version of the architecture and an application based on it were created in this work to expedite Microsoft ETL development.






