Política de escalonamento de recursos computacionais em clusters de física de altas energias


Autoria(s): Fabiana Fortes Rodrigues
Contribuinte(s)

Marcio Portes de Albuquerque

Alberto Franco de Sá Santoro

Carlos Antonio de Moura

Alexandre Sztajnberg

Data(s)

30/10/2012

Resumo

Este trabalho apresenta uma proposta para permitir o uso compartilhado dos recursos computacionais utilizados em um cluster de forma a atender simultaneamente aos quatro experimentos do CERN. A abordagem adotada utiliza o conceito de contratos, onde os requisitos e restrições de cada experimento são descritos em perfis, e uma política de alocação de recursos é definida para manter a utilização dos recursos de forma a atender aos perfis. Propomos um modelo de arquitetura para gerenciar o uso compartilhado de um cluster pelas quatro Organizações Virtuais do LHC. Este modelo de arquitetura é composto de elementos comuns a um cluster típico da Tier-2, acrescidos de funcionalidades para controlar a admissão de novos jobs de todas as Organizações Virtuais do LHC. Este modelo monitora a utilização de recursos do cluster por cada OV, aloca recursos para cada job de acordo com uma política estabelecida para o cluster de forma a procurar respeitar os requisitos de cada uma delas. Definimos um algoritmo para o escalonamento de jobs, que utiliza mecanismos de preempção para controlar a alocação de nós do cluster dependendo o uso corrente e acumulado de recursos por cada OV. Este algoritmo é executado em um dos elementos da arquitetura batizado de broker, dado que o mesmo intermedeia a chegada de novos jobs e a alocação dos nós do cluster, e tem com objetivo manter o controle dos contratos de cada OV. A simulação da arquitetura proposta foi feita no simulador de grades GridSim e os resultados obtidos foram avaliados.

This paper presents a proposal to allow the shared use of computing resources available in a cluster in order to support simultaneously the four experiments at CERN. The approach uses the concept of contracts, where the requirements and restrictions of each experiment are described in profiles, and a resource allocation policy is set to maintain the use of resources to meet those profiles. We propose an architecture model to manage the shared use of a cluster by the four LHC Virtual Organizations. This architectural model is composed of elements common to a typical Tier-2 cluster plus features to control the admission of new jobs from all LHC Virtual Organizations. This model monitores the resource usage for each cluster VO, allocates resources to each job according to an established policy for the cluster in order to seek compliance with requirements of each VO. We define an algorithm for scheduling jobs, that uses preemption mechanisms for controlling the allocation of cluster nodes depending on the current use of resources and accumulated by each VO. This algorithm runs in one of the elements of architecture named broker, since it mediates the influx of new jobs and the allocation of the cluster nodes, and is aiming to keep control of contracts for each VO. The simulation of the proposed architecture was done in GridSim simulator grid and the results were evaluated.

Formato

PDF

Identificador

http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=6404

Idioma(s)

pt

Publicador

Biblioteca Digital de Teses e Dissertações da UERJ

Direitos

Liberar o conteúdo dos arquivos para acesso público

Palavras-Chave #Cluster #Organização Virtual #Compartilhamento de recursos #Cluster #Virtual Organization #Resource sharing #SISTEMAS DE COMPUTACAO #Arquitetura de computador #Processamento paralelo
Tipo

Eletronic Thesis or Dissertation

Tese ou Dissertação Eletrônica