6 resultados para Impala, Hadoop, Big Data, HDFS, Social Business Intelligence, SBI, cloudera
em Dalarna University College Electronic Archive
Resumo:
Market research is often conducted through conventional methods such as surveys, focus groups and interviews. But the drawbacks of these methods are that they can be costly and timeconsuming. This study develops a new method, based on a combination of standard techniques like sentiment analysis and normalisation, to conduct market research in a manner that is free and quick. The method can be used in many application-areas, but this study focuses mainly on the veganism market to identify vegan food preferences in the form of a profile. Several food words are identified, along with their distribution between positive and negative sentiments in the profile. Surprisingly, non-vegan foods such as cheese, cake, milk, pizza and chicken dominate the profile, indicating that there is a significant market for vegan-suitable alternatives for such foods. Meanwhile, vegan-suitable foods such as coconut, potato, blueberries, kale and tofu also make strong appearances in the profile. Validation is performed by using the method on Volkswagen vehicle data to identify positive and negative sentiment across five car models. Some results were found to be consistent with sales figures and expert reviews, while others were inconsistent. The reliability of the method is therefore questionable, so the results should be used with caution.
Resumo:
Inom Business Intelligence har begreppet Self-Service Business Intelligence (Self-Service BI) vuxit fram. Self-Service BI omfattar verktyg vilka möjliggör för slutanvändare att göra analyser och skapa rapporter utan teknisk support. Ett av dessa verktyg är Microsoft PowerPivot.På Transportstyrelsens Järnvägsavdelning finns behov av ett Self-Service BI-verktyg. Vi fick i uppdrag av Sogeti att undersöka om PowerPivot var ett lämpligt verktyg för Transportstyrelsen. Målet med uppsatsen har varit att testa vilka tekniska möjligheter och begränsningar PowerPivot har samt huruvida PowerPivot är användbart för Transportstyrelsen.För att få en djupare förståelse för Self-Service BI har vi kartlagt vilka möjligheter och begränsningar med Self-Service BI-verktyg som finns beskrivna i litteraturen. Vi har sedan jämfört dessa med våra testresultat vilket har varit syftet med uppsatsen.Resultatet av testerna har visat att Transportstyrelsens Järnvägsavdelning initialt behöver teknisk support för att använda PowerPivot. Testerna har även visat att vissa av Transportstyrelsens krav inte kan uppfyllas. Detta minskar användbarheten för Transportstyrelsen.Vidare har vi kommit fram till att Self-Service BI inte alltid är enkelt att använda för slutanvändare utan teknisk support. Resultatet visar även att det krävs en BI-infrastruktur för att enkelt skapa rapporter med god kvalitet och högsta möjliga korrekthet.
Resumo:
Denna rapport behandlar vilka egenskaper som är viktiga att ta hänsyn till vid val av rapportverktyg inom området Business Intelligence. Begreppet BI är relativt omfattande och syftar till färdigheter, teknologier, applikationer och metoder av systematisk och vetenskaplig art som en organisation använder för att bättre förstå sin verksamhet, sin omgivning och omvärld. Rapportverktyg utgör således en mindre del i en större kedja av processer för att stödja beslutstagande.Landstinget Dalarna har anlitat Sogeti, som har varit vår uppdragsgivare för detta examensarbete, för att implementera BI i sin verksamhet och vår studie har sitt ursprung i att Landstinget Dalarna idag har ett stort behov av olika typer av rapporter i många olika delar av organisationen. Rapportbehovet har visat sig vara omfattande och för att lätta på arbetsbördan för de systemutvecklare som skapar rapporter har funderingar framkommit att det skulle kunna vara en bra lösning att låta användarna inom Landstinget Dalarna själva skapa en del av sina egna rapporter. Målet med arbetet är att ge de systemutvecklare som arbetar i projektet riktlinjer kring vilka egenskaper olika rapportverktyg innehar för att de enklare skall kunna avgöra vilket som är lämpligast att använda. De verktyg som i denna studie jämförs med varandra är Report Builder 3.0, PowerPivot samt Dashboard Designer 2010, samtliga från Microsoft.För att göra denna jämförelse mellan olika rapportverktyg krävs bra underlag för att kunna förstå vilka egenskaper som är relevanta att fokusera på samt om några egenskaper väger tyngre än andra.Efter att ha utfört intervjuer med systemutvecklare som arbetar med BI har vi kunnat skapa oss en tydligare bild av detta område. Egenskaperna har sammanställts för att användas i vår jämförelse mellan de olika rapportverktygen. Att dessa egenskaper är av vikt bekräftas till viss del av den teori som finns på området. De egenskaper som främst visar sig vara viktiga i valet är vilken befintlig plattform som används, verktygets möjlighet att skapa interaktiva rapporter samt vilken typ av användare verktyget riktar sig till. Även andra egenskaper visar sig vara viktiga att ta hänsyn till, men då främst beroende på vilka krav som ställs. Resultatet av den praktiska jämförelsen mellan de olika rapportverktygen visar att verktygen till viss del överlappar varandra i funktionalitet samtidigt som de är anpassade för olika typer av användare och plattformar. De utgör allihop delar i Microsofts BI-pussel som på olika sätt skall bidra till att alltid kunna täcka upp de krav som kan finnas beroende på behov och förutsättningar. Samtidigt visar det sig att jämförda rapportverktyg besitter vissa generella egenskaper som gör att verktygen i stora drag klarar, om än på olika sätt, att skapa snarlika rapporter.
Resumo:
The Twitter System is the biggest social network in the world, and everyday millions of tweets are posted and talked about, expressing various views and opinions. A large variety of research activities have been conducted to study how the opinions can be clustered and analyzed, so that some tendencies can be uncovered. Due to the inherent weaknesses of the tweets - very short texts and very informal styles of writing - it is rather hard to make an investigation of tweet data analysis giving results with good performance and accuracy. In this paper, we intend to attack the problem from another aspect - using a two-layer structure to analyze the twitter data: LDA with topic map modelling. The experimental results demonstrate that this approach shows a progress in twitter data analysis. However, more experiments with this method are expected in order to ensure that the accurate analytic results can be maintained.
Resumo:
Data mining is a relatively new field of research that its objective is to acquire knowledge from large amounts of data. In medical and health care areas, due to regulations and due to the availability of computers, a large amount of data is becoming available [27]. On the one hand, practitioners are expected to use all this data in their work but, at the same time, such a large amount of data cannot be processed by humans in a short time to make diagnosis, prognosis and treatment schedules. A major objective of this thesis is to evaluate data mining tools in medical and health care applications to develop a tool that can help make rather accurate decisions. In this thesis, the goal is finding a pattern among patients who got pneumonia by clustering of lab data values which have been recorded every day. By this pattern we can generalize it to the patients who did not have been diagnosed by this disease whose lab values shows the same trend as pneumonia patients does. There are 10 tables which have been extracted from a big data base of a hospital in Jena for my work .In ICU (intensive care unit), COPRA system which is a patient management system has been used. All the tables and data stored in German Language database.
Resumo:
Denna studie syftar till att undersöka hur en stor organisation arbetar med förvaltning av information genom att undersöka dess nuvarande informationsförvaltning, samt undersöka eventuella förslag till framtida informationsförvaltning. Vidare syftar studien också till att undersöka hur en stor organisation kan etablera en tydlig styrning, samverkan, hantering och ansvars- och rollfördelning kring informationsförvaltning. Denna studie är kvalitativ, där datainsamlingen sker genom dokumentstudier och intervjuer. Studien bedrivs med abduktion och är en normativ fallstudie då studiens mål är att ge vägledning och föreslå åtgärder till det fall som uppdragsgivaren har bett mig att studera. Fallet i denna studie är ett typiskt fall, då studiens resultat kan vara i intresse för fler än studiens uppdragsgivare, exempelvis organisationer med liknande informationsmiljö. För att samla teori till studien så har jag genomfört litteraturstudier om ämnen som är relevanta för studiens syfte: Informationsförvaltning, Business Intelligence, Data Warehouse och dess arkitektur, samt Business Intelligence Competency Center. Denna studie bidrar med praktiskt kunskapsbidrag, då studien ger svar på praktiska problem. Uppdragsgivaren har haft praktiska problem i och med en icke fungerade informationsförvaltning, och denna studie har bidragit med förslag på framtida informationsförvaltning. Förslaget på framtida informationsförvaltning involverar ett centraliserat Data Warehouse, samt utvecklingen utav en verksamhet som hanterar informationsförvaltning och styrningen kring informationsförvaltningen inom hela organisationen.