Large-scale Network Analysis on Distributed Architectures


Autoria(s): Paolino, Carmine
Contribuinte(s)

Marzolla, Moreno

Data(s)

23/03/2011

Resumo

Questa dissertazione esamina le sfide e i limiti che gli algoritmi di analisi di grafi incontrano in architetture distribuite costituite da personal computer. In particolare, analizza il comportamento dell'algoritmo del PageRank così come implementato in una popolare libreria C++ di analisi di grafi distribuiti, la Parallel Boost Graph Library (Parallel BGL). I risultati qui presentati mostrano che il modello di programmazione parallela Bulk Synchronous Parallel è inadatto all'implementazione efficiente del PageRank su cluster costituiti da personal computer. L'implementazione analizzata ha infatti evidenziato una scalabilità negativa, il tempo di esecuzione dell'algoritmo aumenta linearmente in funzione del numero di processori. Questi risultati sono stati ottenuti lanciando l'algoritmo del PageRank della Parallel BGL su un cluster di 43 PC dual-core con 2GB di RAM l'uno, usando diversi grafi scelti in modo da facilitare l'identificazione delle variabili che influenzano la scalabilità. Grafi rappresentanti modelli diversi hanno dato risultati differenti, mostrando che c'è una relazione tra il coefficiente di clustering e l'inclinazione della retta che rappresenta il tempo in funzione del numero di processori. Ad esempio, i grafi Erdős–Rényi, aventi un basso coefficiente di clustering, hanno rappresentato il caso peggiore nei test del PageRank, mentre i grafi Small-World, aventi un alto coefficiente di clustering, hanno rappresentato il caso migliore. Anche le dimensioni del grafo hanno mostrato un'influenza sul tempo di esecuzione particolarmente interessante. Infatti, si è mostrato che la relazione tra il numero di nodi e il numero di archi determina il tempo totale.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/1966/1/paolino_carmine_tesi.pdf

Paolino, Carmine (2011) Large-scale Network Analysis on Distributed Architectures. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM509] <http://amslaurea.unibo.it/view/cds/CDS0099/>

Relação

http://amslaurea.unibo.it/1966/

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #PageRank, Parallel, Distributed, Network, Analysis, C++, BGL, PBGL, Boost, Graph, Library, Scalability, Grafi, Calcolo, Parallelo, Analisi, Scalabilità, Reti #scuola :: 843899 :: Scienze #cds :: 0099 :: Informatica [L-DM509] #sessione :: terza
Tipo

PeerReviewed