栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

硬件缓存事件和性能

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

硬件缓存事件和性能

用户@Margaret指出注释中的合理答案-阅读内核源代码以查看PMU事件的映射。

我们可以检查arch / x86 / events / intel /
core.c
中的事件定义。我实际上不知道这里的“核心”是否指的是Core体系结构,就大多数定义而言,这是最合适的-
但无论如何,这就是您要查看的文件。

关键部分是此部分,它定义了

skl_hw_cache_event_ids

static __initconst const u64 skl_hw_cache_event_ids     [PERF_COUNT_HW_CACHE_MAX]     [PERF_COUNT_HW_CACHE_OP_MAX]     [PERF_COUNT_HW_CACHE_RESULT_MAX] ={ [ C(L1D ) ] = {    [ C(OP_READ) ] = {        [ C(RESULT_ACCESS) ] = 0x81d0,          [ C(RESULT_MISS)   ] = 0x151,       },    [ C(OP_WRITE) ] = {        [ C(RESULT_ACCESS) ] = 0x82d0,          [ C(RESULT_MISS)   ] = 0x0,    },    [ C(OP_PREFETCH) ] = {        [ C(RESULT_ACCESS) ] = 0x0,        [ C(RESULT_MISS)   ] = 0x0,    },},...

解码嵌套初始化,你得到的

L1D-dcahe-load
对应
MEM_INST_RETIRED.ALL_LOAD
L1-dcache-load-misses
L1D.REPLACEMENT

我们可以用perf仔细检查一下:

$ ocperf stat -e mem_inst_retired.all_loads,L1-dcache-loads,l1d.replacement,L1-dcache-load-misses,L1-dcache-loads,mem_load_retired.l1_hit head -c100M /dev/zero > /dev/null Performance counter stats for 'head -c100M /dev/zero':        11,587,793      mem_inst_retired_all_loads          11,587,793      L1-dcache-loads  20,233      l1d_replacement  20,233      L1-dcache-load-misses     #    0.17% of all L1-dcache hits          11,587,793      L1-dcache-loads         11,495,053      mem_load_retired_l1_hit       0.024322360 seconds time elapsed

“硬件缓存”事件显示的值与使用我们检查源时猜测的基础PMU事件的值完全相同。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/381600.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号