栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

高速缓存高效矩阵转置程序?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

高速缓存高效矩阵转置程序?

您可能需要四个循环-
两个循环遍历这些块,然后另外两个循环执行单个块的转置复制。为了简单起见,假设块大小可以划分矩阵的大小,我想是这样的,尽管我想在信封的背面绘制一些图片以确保:

for (int i = 0; i < n; i += blocksize) {    for (int j = 0; j < n; j += blocksize) {        // transpose the block beginning at [i,j]        for (int k = i; k < i + blocksize; ++k) { for (int l = j; l < j + blocksize; ++l) {     dst[k + l*n] = src[l + k*n]; }        }    }}

还有一个重要的重要见解,就是实际上有一个可以忽略缓存的算法(请参阅http://en.wikipedia.org/wiki/Cache-
oblivious_algorithm
,以该确切问题为例)。“忽略缓存”的非正式定义是,您无需尝试调整任何参数(在本例中为块大小)即可达到良好/最佳的缓存性能。在这种情况下,解决方案是通过将矩阵递归地分成两半,然后将两半移到它们在目标位置的正确位置来进行转置。

无论实际上缓存大小是多少,此递归都可以利用它。我希望与您的策略相比,会有一些额外的管理开销,这实际上是使用性能实验来直接跳到缓存真正开始的递归点,并且不再走下去。另一方面,您的性能实验可能会给您一个答案,该答案适用于您的计算机,但不适用于您客户的计算机。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/398203.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号