GOTOBLAS一般矩阵乘法高效实现机制的研究


Autoria(s): 蒋孟奇; 张云泉; 宋刚; 李玉成
Data(s)

2008

Resumo

对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性.

Identificador

http://ir.iscas.ac.cn/handle/311060/4298

http://www.irgrid.ac.cn/handle/1471x/66544

Idioma(s)

中文

Fonte

蒋孟奇; 张云泉; 宋刚; 李玉成.GOTOBLAS一般矩阵乘法高效实现机制的研究,计算机工程,2008,34(7):84

Palavras-Chave #GOTOBLAS库 #一般矩阵乘法 #存储层次 #分块算法 #计算模型 GOTOBLAS #general matrix-matrix multiplication #hierarchical memory #blocking algorithm #computational models
Tipo

期刊论文