GOTOBLAS一般矩阵乘法高效实现机制的研究
Data(s) |
2008
|
---|---|
Resumo |
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性. |
Identificador | |
Idioma(s) |
中文 |
Fonte |
蒋孟奇; 张云泉; 宋刚; 李玉成.GOTOBLAS一般矩阵乘法高效实现机制的研究,计算机工程,2008,34(7):84 |
Palavras-Chave | #GOTOBLAS库 #一般矩阵乘法 #存储层次 #分块算法 #计算模型 GOTOBLAS #general matrix-matrix multiplication #hierarchical memory #blocking algorithm #computational models |
Tipo |
期刊论文 |