Adriana C. Barbosa, Lucia Catabriga, Alberto F. De Souza, Andréa M.P. Valli.
Neste trabalho analisamos o desempenho paralelo de um código de elementos finitos em Clusters Multi-core considerando duas alternativas de particionamento do job paralelo MPI entre os cores: single-core, na qual apenas um processo ´e enviado para cada máquina multi-core; e fill-up, na qual todos os cores de cada máquina do Cluster recebem processos. A aplicação envolve o escoamento miscível de fluido incompressível em meio poroso, mais especificamente, a simulação de traçadores no contexto da Engenharia de Petróleo. Nós medimos o tempo de processamento e o speedup obtidos em dois Clusters de computadores multi-core: um composto por 31 máquinas, cada uma com uma Unidade Central de Processamento (Central Processing Unit - CPU) dual-core (Enterprise 2); e outro composto por 29 máquinas, cada uma com uma CPU quad-core (Enterprise 3). Além disso, analisamos a eficiência dos algoritmos de escalonamento no Enterprise 3 em termos da comunicação externa entre as CPUs e a concorrência dos cores pela hierarquia de memória das CPUs. Nossos resultados mostraram que, muito embora máquinas mais modernas como o Enterprise 3 possuam um número maior de cores e estes sejam mais rápidos, a competição destes cores pela hierarquia de memória tem grande impacto no desempenho final das aplicações.
http://www.lbd.dcc.ufmg.br/colecoes/wscad/2009/011.pdf
Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web