Online Stream Processing di Big Data su Apache Storm per Applicazioni di Instant Coupon
Contribuinte(s) |
Bellavista, Paolo |
---|---|
Data(s) |
16/03/2016
|
Resumo |
Big data è il termine usato per descrivere una raccolta di dati così estesa in termini di volume,velocità e varietà da richiedere tecnologie e metodi analitici specifici per l'estrazione di valori significativi. Molti sistemi sono sempre più costituiti e caratterizzati da enormi moli di dati da gestire,originati da sorgenti altamente eterogenee e con formati altamente differenziati,oltre a qualità dei dati estremamente eterogenei. Un altro requisito in questi sistemi potrebbe essere il fattore temporale: sempre più sistemi hanno bisogno di ricevere dati significativi dai Big Data il prima possibile,e sempre più spesso l’input da gestire è rappresentato da uno stream di informazioni continuo. In questo campo si inseriscono delle soluzioni specifiche per questi casi chiamati Online Stream Processing. L’obiettivo di questa tesi è di proporre un prototipo funzionante che elabori dati di Instant Coupon provenienti da diverse fonti con diversi formati e protocolli di informazioni e trasmissione e che memorizzi i dati elaborati in maniera efficiente per avere delle risposte in tempo reale. Le fonti di informazione possono essere di due tipologie: XMPP e Eddystone. Il sistema una volta ricevute le informazioni in ingresso, estrapola ed elabora codeste fino ad avere dati significativi che possono essere utilizzati da terze parti. Lo storage di questi dati è fatto su Apache Cassandra. Il problema più grosso che si è dovuto risolvere riguarda il fatto che Apache Storm non prevede il ribilanciamento delle risorse in maniera automatica, in questo caso specifico però la distribuzione dei clienti durante la giornata è molto varia e ricca di picchi. Il sistema interno di ribilanciamento sfrutta tecnologie innovative come le metriche e sulla base del throughput e della latenza esecutiva decide se aumentare/diminuire il numero di risorse o semplicemente non fare niente se le statistiche sono all’interno dei valori di soglia voluti. |
Formato |
application/pdf |
Identificador |
http://amslaurea.unibo.it/10311/1/Online_Stream_Processing_.pdf Tahiri, Ardit (2016) Online Stream Processing di Big Data su Apache Storm per Applicazioni di Instant Coupon. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270] <http://amslaurea.unibo.it/view/cds/CDS0937/> |
Relação |
http://amslaurea.unibo.it/10311/ |
Direitos |
info:eu-repo/semantics/openAccess |
Palavras-Chave | #BigData StreamProcessing ApacheStorm Storm ApacheCassandra Eddystone XMPP LoadBalancing Metric #scuola :: 843884 :: Ingegneria e Architettura #cds :: 0937 :: Ingegneria informatica [LM-DM270] #sessione :: terza |
Tipo |
PeerReviewed |