来源: https://www.bilibili.com/video/BV19S4y1F7xq?spm_id_from=333.999.0.0
说明:具体占用的byte和python版本,系统版本(不同的windows版本或者linux或者MAC OS)有关,大体上所表达的意思明白就好.
一、 现象
三个元素一样的列表,内存占用却不一样
import sys sys.getsizeof([0]*3) 80 sys.getsizeof([0,0,0]) 120 sys.getsizeof([0 for _ in range(3)]) 88二、原因
这三个方法调用的底层C函数不同。(python底层是用C语言实现的,python会被转化层字节码,C语言解析字节码,并用C语言运行)
下面是不同的方法的字节码(利用dis模块可以查看),可以看到3个不同的方法的字节码是不一样的,每个方法的核心如下面的箭头所指
因为此时,C语言内部的实现方式是直接申请了3个指针,指向三个元素。
在测试平台上,空的list是56个byte,64bit的系统上每个指针是8个byte,因此总共是80个byte
此时内部直接调用list_resize(3)这个函数,意思是就是申请3个对象,但是动态数组会自动多申请一些(参见C++ std::vector的动态扩容机制) 。按照C里面的实现会直接申请8个内存块,那么8个指针就是64个byte,加上空list自带的56个byte,总共就是120个byte
2.3 [0 for _ in range(3)] 为什么是88个byte因为内部会循环调用list_resize 分别是list_resize(1) list_resize(2) list_resize(3) .按照C里面的实现方式list_resize(1) 就会分配4个内存块,在后面使用 list_resize(2) list_resize(3)的时候,因为当前空间已经满足用户的使用了,所以就不会再申请空间了。(类似C++的std::vector的扩容机制)



