普通全局变量不是每个CPU的。自动变量位于堆栈中,并且不同的CPU使用不同的堆栈,因此自然会得到单独的变量。
我猜您指的是Linux的每CPU变量基础结构。
大部分魔力在这里(
asm-generic/percpu.h):
extern unsigned long __per_cpu_offset[NR_CPUS];#define per_cpu_offset(x) (__per_cpu_offset[x])#define DEFINE_PER_CPU(type, name) __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))#define __get_cpu_var(var) per_cpu(var, smp_processor_id())宏
RELOC_HIDE(ptr, offset)仅以
ptr字节为单位偏移给定的偏移量(无论指针类型如何)。
它有什么作用?
- 定义时
DEFINE_PER_CPU(int, x)
,将__per_cpu_x
在特殊.data.percpu
部分中创建一个整数。 - 加载内核后,此部分将被加载多次-每个CPU一次(魔术的这一部分不在上面的代码中)。
- 该
__per_cpu_offset
阵列填充有副本之间的距离。假设每个cpu数据使用1000字节,则__per_cpu_offset[n]
包含1000*n
。 per_cpu__x
在加载期间,该符号将重定位到CPU 0的per_cpu__x
。__get_cpu_var(x)
在CPU 3上运行时,将转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3])
。从CPU 0开始,x
在CPU 0的数据和CPU 3的数据之间增加偏移量,最后取消对结果指针的引用。



