面向高性能数值计算的并行计算模型DRAM(h)


Autoria(s): 张云泉
Data(s)

2003

Resumo

提出了一个基于存储层次的新并行计算模型DRAM(h),并在该模型下对两个经典并行数值计算算法的不同实现形式:四种形式并行了三角方程求解(PTRS)和六种形式无列选主元并行LU分解(PLU),进行了分析。模型分析表明,具有近乎相同时间和空间复杂性的同一算法不同实现形式在该模型下会有完全不同的存储复杂度。作者在日立公司SR2201 MPP并行机、曙光3000超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的128节点Linux Cluster等三种并行计算平台上对模型分析结果进行了实验验证。结果表明,该模型分析在绝大数情况下都能较好地与不同实验枰台上的实验结果吻合。个别出现偏差的分析结果,在根据计算平台的存储层次特点修改模型分析的假定后,也能够进行解释。这说明了该模型以不同形式的算法实现进行存储访问模式区分的有效性。对在计算模型中加入指令/线程级并行的可行性和方法的研究是下一步的工作。

Identificador

http://ir.iscas.ac.cn/handle/311060/4318

http://www.irgrid.ac.cn/handle/1471x/66575

Idioma(s)

中文

Fonte

张云泉.面向高性能数值计算的并行计算模型DRAM(h),计算机学报,2003,26(12):1660-1670

Palavras-Chave #高性能数值计算 #存储复杂性 #并行计算模型 high performance numerical computing #memory complexity #parallel computation model
Tipo

期刊论文