6 resultados para Data mining, Business intelligence, Previsioni di mercato
em Dalarna University College Electronic Archive
Resumo:
Inom Business Intelligence har begreppet Self-Service Business Intelligence (Self-Service BI) vuxit fram. Self-Service BI omfattar verktyg vilka möjliggör för slutanvändare att göra analyser och skapa rapporter utan teknisk support. Ett av dessa verktyg är Microsoft PowerPivot.På Transportstyrelsens Järnvägsavdelning finns behov av ett Self-Service BI-verktyg. Vi fick i uppdrag av Sogeti att undersöka om PowerPivot var ett lämpligt verktyg för Transportstyrelsen. Målet med uppsatsen har varit att testa vilka tekniska möjligheter och begränsningar PowerPivot har samt huruvida PowerPivot är användbart för Transportstyrelsen.För att få en djupare förståelse för Self-Service BI har vi kartlagt vilka möjligheter och begränsningar med Self-Service BI-verktyg som finns beskrivna i litteraturen. Vi har sedan jämfört dessa med våra testresultat vilket har varit syftet med uppsatsen.Resultatet av testerna har visat att Transportstyrelsens Järnvägsavdelning initialt behöver teknisk support för att använda PowerPivot. Testerna har även visat att vissa av Transportstyrelsens krav inte kan uppfyllas. Detta minskar användbarheten för Transportstyrelsen.Vidare har vi kommit fram till att Self-Service BI inte alltid är enkelt att använda för slutanvändare utan teknisk support. Resultatet visar även att det krävs en BI-infrastruktur för att enkelt skapa rapporter med god kvalitet och högsta möjliga korrekthet.
Resumo:
Denna rapport behandlar vilka egenskaper som är viktiga att ta hänsyn till vid val av rapportverktyg inom området Business Intelligence. Begreppet BI är relativt omfattande och syftar till färdigheter, teknologier, applikationer och metoder av systematisk och vetenskaplig art som en organisation använder för att bättre förstå sin verksamhet, sin omgivning och omvärld. Rapportverktyg utgör således en mindre del i en större kedja av processer för att stödja beslutstagande.Landstinget Dalarna har anlitat Sogeti, som har varit vår uppdragsgivare för detta examensarbete, för att implementera BI i sin verksamhet och vår studie har sitt ursprung i att Landstinget Dalarna idag har ett stort behov av olika typer av rapporter i många olika delar av organisationen. Rapportbehovet har visat sig vara omfattande och för att lätta på arbetsbördan för de systemutvecklare som skapar rapporter har funderingar framkommit att det skulle kunna vara en bra lösning att låta användarna inom Landstinget Dalarna själva skapa en del av sina egna rapporter. Målet med arbetet är att ge de systemutvecklare som arbetar i projektet riktlinjer kring vilka egenskaper olika rapportverktyg innehar för att de enklare skall kunna avgöra vilket som är lämpligast att använda. De verktyg som i denna studie jämförs med varandra är Report Builder 3.0, PowerPivot samt Dashboard Designer 2010, samtliga från Microsoft.För att göra denna jämförelse mellan olika rapportverktyg krävs bra underlag för att kunna förstå vilka egenskaper som är relevanta att fokusera på samt om några egenskaper väger tyngre än andra.Efter att ha utfört intervjuer med systemutvecklare som arbetar med BI har vi kunnat skapa oss en tydligare bild av detta område. Egenskaperna har sammanställts för att användas i vår jämförelse mellan de olika rapportverktygen. Att dessa egenskaper är av vikt bekräftas till viss del av den teori som finns på området. De egenskaper som främst visar sig vara viktiga i valet är vilken befintlig plattform som används, verktygets möjlighet att skapa interaktiva rapporter samt vilken typ av användare verktyget riktar sig till. Även andra egenskaper visar sig vara viktiga att ta hänsyn till, men då främst beroende på vilka krav som ställs. Resultatet av den praktiska jämförelsen mellan de olika rapportverktygen visar att verktygen till viss del överlappar varandra i funktionalitet samtidigt som de är anpassade för olika typer av användare och plattformar. De utgör allihop delar i Microsofts BI-pussel som på olika sätt skall bidra till att alltid kunna täcka upp de krav som kan finnas beroende på behov och förutsättningar. Samtidigt visar det sig att jämförda rapportverktyg besitter vissa generella egenskaper som gör att verktygen i stora drag klarar, om än på olika sätt, att skapa snarlika rapporter.
Resumo:
Denna studie syftar till att undersöka hur en stor organisation arbetar med förvaltning av information genom att undersöka dess nuvarande informationsförvaltning, samt undersöka eventuella förslag till framtida informationsförvaltning. Vidare syftar studien också till att undersöka hur en stor organisation kan etablera en tydlig styrning, samverkan, hantering och ansvars- och rollfördelning kring informationsförvaltning. Denna studie är kvalitativ, där datainsamlingen sker genom dokumentstudier och intervjuer. Studien bedrivs med abduktion och är en normativ fallstudie då studiens mål är att ge vägledning och föreslå åtgärder till det fall som uppdragsgivaren har bett mig att studera. Fallet i denna studie är ett typiskt fall, då studiens resultat kan vara i intresse för fler än studiens uppdragsgivare, exempelvis organisationer med liknande informationsmiljö. För att samla teori till studien så har jag genomfört litteraturstudier om ämnen som är relevanta för studiens syfte: Informationsförvaltning, Business Intelligence, Data Warehouse och dess arkitektur, samt Business Intelligence Competency Center. Denna studie bidrar med praktiskt kunskapsbidrag, då studien ger svar på praktiska problem. Uppdragsgivaren har haft praktiska problem i och med en icke fungerade informationsförvaltning, och denna studie har bidragit med förslag på framtida informationsförvaltning. Förslaget på framtida informationsförvaltning involverar ett centraliserat Data Warehouse, samt utvecklingen utav en verksamhet som hanterar informationsförvaltning och styrningen kring informationsförvaltningen inom hela organisationen.
Resumo:
Data mining is a relatively new field of research that its objective is to acquire knowledge from large amounts of data. In medical and health care areas, due to regulations and due to the availability of computers, a large amount of data is becoming available [27]. On the one hand, practitioners are expected to use all this data in their work but, at the same time, such a large amount of data cannot be processed by humans in a short time to make diagnosis, prognosis and treatment schedules. A major objective of this thesis is to evaluate data mining tools in medical and health care applications to develop a tool that can help make rather accurate decisions. In this thesis, the goal is finding a pattern among patients who got pneumonia by clustering of lab data values which have been recorded every day. By this pattern we can generalize it to the patients who did not have been diagnosed by this disease whose lab values shows the same trend as pneumonia patients does. There are 10 tables which have been extracted from a big data base of a hospital in Jena for my work .In ICU (intensive care unit), COPRA system which is a patient management system has been used. All the tables and data stored in German Language database.
Resumo:
The main purpose of this thesis project is to prediction of symptom severity and cause in data from test battery of the Parkinson’s disease patient, which is based on data mining. The collection of the data is from test battery on a hand in computer. We use the Chi-Square method and check which variables are important and which are not important. Then we apply different data mining techniques on our normalize data and check which technique or method gives good results.The implementation of this thesis is in WEKA. We normalize our data and then apply different methods on this data. The methods which we used are Naïve Bayes, CART and KNN. We draw the Bland Altman and Spearman’s Correlation for checking the final results and prediction of data. The Bland Altman tells how the percentage of our confident level in this data is correct and Spearman’s Correlation tells us our relationship is strong. On the basis of results and analysis we see all three methods give nearly same results. But if we see our CART (J48 Decision Tree) it gives good result of under predicted and over predicted values that’s lies between -2 to +2. The correlation between the Actual and Predicted values is 0,794in CART. Cause gives the better percentage classification result then disability because it can use two classes.
Predictive models for chronic renal disease using decision trees, naïve bayes and case-based methods
Resumo:
Data mining can be used in healthcare industry to “mine” clinical data to discover hidden information for intelligent and affective decision making. Discovery of hidden patterns and relationships often goes intact, yet advanced data mining techniques can be helpful as remedy to this scenario. This thesis mainly deals with Intelligent Prediction of Chronic Renal Disease (IPCRD). Data covers blood, urine test, and external symptoms applied to predict chronic renal disease. Data from the database is initially transformed to Weka (3.6) and Chi-Square method is used for features section. After normalizing data, three classifiers were applied and efficiency of output is evaluated. Mainly, three classifiers are analyzed: Decision Tree, Naïve Bayes, K-Nearest Neighbour algorithm. Results show that each technique has its unique strength in realizing the objectives of the defined mining goals. Efficiency of Decision Tree and KNN was almost same but Naïve Bayes proved a comparative edge over others. Further sensitivity and specificity tests are used as statistical measures to examine the performance of a binary classification. Sensitivity (also called recall rate in some fields) measures the proportion of actual positives which are correctly identified while Specificity measures the proportion of negatives which are correctly identified. CRISP-DM methodology is applied to build the mining models. It consists of six major phases: business understanding, data understanding, data preparation, modeling, evaluation, and deployment.