SpMV的自动性能优化实现技术及其应用研究


Autoria(s): 袁娥; 张云泉; 刘芳芳; 孙相征
Data(s)

2009

Resumo

在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.

Identificador

http://ir.iscas.ac.cn/handle/311060/4286

http://www.irgrid.ac.cn/handle/1471x/66524

Fonte

袁娥; 张云泉; 刘芳芳; 孙相征.SpMV的自动性能优化实现技术及其应用研究,计算机研究与发展,2009,46(7):1117-1126

Palavras-Chave #稀疏矩阵向量乘 #启发式算法 #自适应性能优化 #存储访问模式 #寄存器分块
Tipo

期刊论文