在上篇文章中,我们大致介绍了Python中列表切片及浅拷贝的关系,从上文的列表切片中,我们已经能大致看出浅拷贝的全貌了。
不管是使用切片的方式获取列表的部分内容还是全部内容,Python都帮我们把列表的索引以及每个列表元素的引用都拷贝了一份,相当于生成了一个新列表,下面我们来详细介绍一下浅拷贝与深拷贝。
浅谈列表的深/浅拷贝
浅拷贝与深拷贝是各大语言中的一个比较热门的话题,具体到每种语言,体现出的含义又略有不同。在Python中,由于它一切皆对象的特性,使得我们经常在浅拷贝与深拷贝这个问题上弄得晕头转向。
浅拷贝在Python中,无论是数值、字符、字符串,还是列表、元组、集合、字典,都看作是一种对象。
列表、元组、集合、字典属于复合对象,它们可以包含数值、字符、字符串,也可以互相嵌套。在不考虑复合对象之间互相嵌套的情形下,浅拷贝解决了复合对象拷贝以后与源对象的数据隔离问题。
我们看如下代码:
originList = ["钢铁侠", "美国队长", "雷神", "冬兵", "浩克", "星爵", "格鲁特", "蚁人", "猩红女巫", "女武神"]
heroList02 = ["幻视", "鹰眼", "蜘蛛侠"]
element = "灭霸"
herolist01 = originList[:]
print("heroList01 的内容是:{}".format(herolist01))
print("heroList01 的地址是:{}".format(hex(id(herolist01))))
print("heroList01 第一个元素的地址是:{}".format(hex(id(herolist01[0]))))
print("originList 的内容是:{}".format(originList))
print("originList 的地址是:{}".format(hex(id(originList))))
print("originList 第一个元素的地址是:{}".format(hex(id(originList[0]))))
print("----------------接下来我们修改heroList第一个元素-----------------")
print("element 的内容是{},地址是{}".format(element, hex(id(element))))
herolist01[0] = element
print("heroList01 的内容是:{}".format(herolist01))
print("heroList01 的地址是:{}".format(hex(id(herolist01))))
print("heroList01 第一个元素的地址是:{}".format(hex(id(herolist01[0]))))
print("originList 的内容是:{}".format(originList))
print("originList 的地址是:{}".format(hex(id(originList))))
print("originList 第一个元素的地址是:{}".format(hex(id(originList[0]))))
在Pycharm中运行上述代码,得到如下输出:
heroList01 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神'] heroList01 的地址是:0x15011868688 heroList01 第一个元素的地址是:0x150105c5390 originList 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神'] originList 的地址是:0x15010485188 originList 第一个元素的地址是:0x150105c5390 ----------------接下来我们修改heroList第一个元素----------------- element 的内容是灭霸,地址是0x150118e9090 heroList01 的内容是:['灭霸', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神'] heroList01 的地址是:0x15011868688 heroList01 第一个元素的地址是:0x150118e9090 originList 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神'] originList 的地址是:0x15010485188 originList 第一个元素的地址是:0x150105c5390
可以看到,使用浅拷贝以后,heroList01与originList之间实现了数据隔离,对heroList01中的元素进行修改不影响originList。
浅拷贝的数据隔离非常类似于Linux内核中的写时复制机制,即浅拷贝发生以后,拷贝的列表与原始列表仍然共享一份数据副本,后续对拷贝的列表或者原始列表进行写入操作时,才会重新申请空间写入新数据。
列表切片属于浅拷贝的一种,对于列表来说,浅拷贝还有其它3种实现方式,分别是工厂方法list()、列表中自带的copy()方法,以及copy库中的copy方法,感兴趣的同学可以去尝试一下,这里不再一一赘述。
深拷贝浅拷贝只解决了复合对象中包含简单对象的数据隔离,当待拷贝的对象中嵌套了其他复合对象的时候,浅拷贝就出问题了。我们看如下代码:
list01 = [1, 2, 3, [4, 5]] list02 = list01[::] print(hex(id(list01[0]))) print(hex(id(list02[0]))) list02[0] = 10 list02[3][0] = 8 print(hex(id(list01[0]))) print(hex(id(list02[0]))) print(list01) print(list02)
代码输出如下:
0x7ffeea02a190 0x7ffeea02a190 0x7ffeea02a190 0x7ffeea02a2b0 [1, 2, 3, [8, 5]] [10, 2, 3, [8, 5]]
可以看到,对于外层元素,两个列表之间实现了数据隔离,而对于嵌套的复合对象,两个列表之间仍然是共享的。我们将上述代码转化成内存示意图,就能更直观地看出在拷贝以及修改过程中究竟发生了什么:
可以看到,浅拷贝在拷贝复杂对象时仍然采取了共享策略,于是,对嵌套列表的修改导致list01、list02的数据都发生了变化。
当我们要对列表中嵌套的列表保持数据隔离时,深拷贝就派上用场了。在Python中,实现深拷贝的方法是调用copy中的deepcopy方法,请看如下代码:
import copy
list01 = [1, 2, 3, [4, 5]]
print("----------------使用深拷贝的方法复制一个list02----------------")
list02 = copy.deepcopy(list01)
print("list01 第一个元素的地址是:{}".format(hex(id(list01[0]))))
print("list01 中嵌套的列表地址是:{}".format(hex(id(list01[3]))))
print("list01 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list01[3][0]))))
print("list02 第一个元素的地址是:{}".format(hex(id(list02[0]))))
print("list02 中嵌套的列表地址是:{}".format(hex(id(list02[3]))))
print("list02 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list02[3][0]))))
print("-----------------下面对list02中的元素进行修改-----------------")
list02[0] = 10
list02[3][0] = 8
print("list01 第一个元素的地址是:{}".format(hex(id(list01[0]))))
print("list01 中嵌套的列表地址是:{}".format(hex(id(list01[3]))))
print("list01 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list01[3][0]))))
print("list02 第一个元素的地址是:{}".format(hex(id(list02[0]))))
print("list02 中嵌套的列表地址是:{}".format(hex(id(list02[3]))))
print("list02 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list02[3][0]))))
print("list01的内容是:{}".format(list01))
print("list02的内容是:{}".format(list02))
如果对python自动化测试、web自动化、接口自动化、移动端自动化、面试经验交流等等感兴趣的测试人,可以 点这自行获取…
上述代码的输出如下:
----------------使用深拷贝的方法复制一个list02---------------- list01 第一个元素的地址是:0x7ffee9d9a190 list01 中嵌套的列表地址是:0x148f6d95188 list01 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0 list02 第一个元素的地址是:0x7ffee9d9a190 list02 中嵌套的列表地址是:0x148f6ecbf08 list02 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0 -----------------下面对list02中的元素进行修改----------------- list01 第一个元素的地址是:0x7ffee9d9a190 list01 中嵌套的列表地址是:0x148f6d95188 list01 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0 list02 第一个元素的地址是:0x7ffee9d9a2b0 list02 中嵌套的列表地址是:0x148f6ecbf08 list02 中嵌套的列表的第一个元素地址是:0x7ffee9d9a270 list01的内容是:[1, 2, 3, [4, 5]] list02的内容是:[10, 2, 3, [8, 5]]
在上述代码的输出中,我们至少可以看出两点:1、对于列表中包含的数值类型,在深拷贝时依然采取了写时复制的策略,也就是说只有当这些元素被修改时才会重新申请空间写入新数据;
2、对于列表中包含的列表,在深拷贝时会逐层拷贝,但嵌套列表中包含的数值类型仍然采取共享策略。
我们用内存图来表达上述深拷贝过程,会更直观更清晰。
列表与函数参数传递在开发过程中经常遇到的一个问题是:列表在函数参数传递时使用的是浅拷贝还是深拷贝?如果你的回答是浅拷贝,那么恭喜你,答错了!
列表在函数参数传递过程中使用的既不是浅拷贝也不是深拷贝,而是简单的引用传递。请看下面的程序:
list01 = ["幻视", "鹰眼", "蜘蛛侠"]
def listPrint(strList):
print(hex(id(strList)))
for item in strList:
print(item, end='t')
print()
strList[0] = "灭霸"
print("--------------在listPrint函数里面----------------")
print(strList)
print(hex(id(list01)))
listPrint(list01)
print("--------------调用完listPrint以后----------------")
print(list01)
程序的输出如下:
0x234a59b5188 0x234a59b5188 幻视 鹰眼 蜘蛛侠 --------------在listPrint函数里面---------------- ['灭霸', '鹰眼', '蜘蛛侠'] --------------调用完listPrint以后---------------- ['灭霸', '鹰眼', '蜘蛛侠']
在进行listPrint函数调用时,解释器仅仅是简单地将list01的引用放在了函数listPrint的栈帧上,在函数listPrint中对列表的修改都将影响到list01。
我们在调用listPrint函数时对list01做一次简单的浅拷贝,观察程序输出:
list01 = ["幻视", "鹰眼", "蜘蛛侠"]
def listPrint(strList):
print(hex(id(strList)))
for item in strList:
print(item, end='t')
print()
strList[0] = "灭霸"
print("--------------在listPrint函数里面----------------")
print(strList)
print(hex(id(list01)))
listPrint(list01.copy())
print("--------------调用完listPrint以后----------------")
print(list01)
上述代码的输出如下:
0x250328b5188 0x250328b5388 幻视 鹰眼 蜘蛛侠 --------------在listPrint函数里面---------------- ['灭霸', '鹰眼', '蜘蛛侠'] --------------调用完listPrint以后---------------- ['幻视', '鹰眼', '蜘蛛侠']
我们发现,此时listPrint对实参的修改已经不能影响到list01了,因为函数listPrint接收到的参数是list01的一份浅拷贝,而不是list01本身,从而实现了一次简单的数据隔离。
深/浅拷贝的拓展上文介绍了列表的深/浅拷贝,在Python中,深/浅拷贝主要发生在可变对象互相嵌套的场景中,包括python内置的可变对象列表、集合、字典,以及元组中嵌套的列表、集合、字典。
除此之外,用户自定义的对象,只要对象属性中包含了可变对象,在对对象进行拷贝的时候就需要考虑使用浅拷贝还是深拷贝,从而实现拷贝对象与源对象的数据隔离。
如果对python自动化测试、web自动化、接口自动化、移动端自动化、面试经验交流等等感兴趣的测试人,可以 点这自行获取…



