Python中的赋值与深浅拷贝

  鉴于对很多初学编程的小伙伴来说,对于赋值和深浅拷贝的用法有些疑问,所以我就结合python变量存储的特性从内存的角度来谈一谈赋值和深浅拷贝~~~

准备知识

一些基本的定义:

  • 在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。
  • 浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制
  • 深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。

几个术语的解释

  • 变量:是一个系统表的元素,拥有指向对象的连接空间
  • 对象:被分配的一块内存,存储其所代表的值
  • 引用:是自动形成的从变量到对象的指针
  • 注意:类型(int类型,long类型(python3已去除long类型,只剩下int类型的数据))属于对象,不是变量
  • 不可变对象:一旦创建就不可修改的对象,包括字符串、元组、数字
  • 可变对象:可以修改的对象,包括列表、字典。

深浅拷贝的作用

  • 减少内存的使用 
  • 以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份,以防数据修改之后,找不到原数据。

对于不可变对象的深浅拷贝

  不可变对象类型(这个不可变对象类型里面不能包含可变对象类型,如元祖里面包含列表就不满足这个条件),没有被拷贝的说法,即便是用深拷贝,查看id的话也是一样的,如果对其重新赋值,也只是新创建一个对象,替换掉旧的而已。一句话就是,不可变类型,不管是深拷贝还是浅拷贝,地址值和拷贝后的值都是一样的。

数字、字符串等不可变数据类型

赋值

举个栗子:

n1 = 123123
n2 = n1
print(n1,n2)
print(id(n1))
print(id(n2))

输出结果:
123123 123123
1607915318992
1607915318992

  在以上代码块当中,a2与a1所赋的值是一样的,都是数字123123。因为python有一个重用机制,对于同一个数字,python并不会开辟一块新的内存空间,而是维护同一块内存地址,只是将该数字对应的内存地址的引用赋值给变量a1和a2。所以根据输出结果,a1和a2其实对应的是同一块内存地址,只是两个不同的引用罢了。同样的,对于a2 = a1,其实效果等同于“a1 = 123123; a2 = 123123”,它也就是将a1指向123123的引用赋值给a2。字符串跟数字的原理雷同,如果把123123改成“abcabc”也是一样的。

结论:对于通过用 = 号赋值,数字和字符串在内存当中用的都是同一块地址。

浅拷贝

同样的栗子:

import copy  # 使用浅拷贝需要导入copy模块

n1 = 123123
n3 = copy.copy(n1)  # 使用copy模块里的copy()函数就是浅拷贝了
print(n1,n3)
print(id(n1))
print(id(n3))

输出结果:
123123 123123
2735567515344
2735567515344

  通过使用copy模块里的copy()函数来进行浅拷贝,把a1拷贝一份赋值给a3,查看输出结果发现,a1和a3的内存地址还是一样。

结论:对于浅拷贝,数字和字符串在内存当中用的也是同一块地址。

深拷贝

再来一个栗子:

import copy

n1 = 123123
n4 = copy.deepcopy(n1)  # 深拷贝是用copy模块里的deepcopy()函数
print(n1,n4)
print(id(n1))
print(id(n4))

输出结果:
123123 123123
2545114525392
2545114525392

  这个。。。还用说嘛,直接看结论>>>

结论:综上所述,对于数字和字符串的赋值、浅拷贝、深拷贝在内存当中用的都是同一块地址。

原理图:

字典、列表等可变数据类型

赋值

再举个栗子

n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n2 = n1  # 赋值
print(n1,n2)
print(id(n1))
print(id(n2))
n1['k1'] = 'c'
n1['k3'][0] = 'd'
print(n1,n2)
print(id(n1))
print(id(n2))

输出结果:

{'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
1867471875528
1867471875528
{'k1': 'c', 'k2': 123, 'k3': ['d', 678]} {'k1': 'c', 'k2': 123, 'k3': ['d', 678]}
1867471875528
1867471875528

 

   我们的栗子当中用了一个字典n1,字典里面嵌套了一个列表,当我们把n1赋值给n2时,内存地址并没有发生变化,因为其实它也是只是把n1的引用拿过来赋值给n2而已(我们用了一个字典来举例,其他类型也是一样的)。正因为如此,当我们修改字典里面的数据时,n1和n2都会发生改变。

  结论:对于赋值,字典、列表等其他类型用的内存地址不会变化。

浅拷贝

栗子走起

import copy

n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n3 = copy.copy(n1)  # 浅拷贝
print(n1,n3)
print("第一层字典的内存地址:")
print(id(n1))
print(id(n3))
print("第二层嵌套的列表的内存地址:")
print(id(n1["k3"]))
print(id(n3["k3"]))
n1['k1'] = 'tom'
n1['k3'][0] = 'jack'
print('***************')
print(n1,n3)


输出结果:
{'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
第一层字典的内存地址:
1506727325128
1506727325200
第二层嵌套的列表的内存地址:
1506758960840
1506758960840
***************
{'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['jack', 678]}

  通过以上结果可以看出,进行浅拷贝时,我们的字典第一层n1和n3指向的内存地址已经改变了,但是对于第二层里的列表并没有拷贝,它的内存地址还是一样的。原理如下图:  

   结论:所以对于浅拷贝,字典、列表等类型,它们只拷贝第一层地址。

深拷贝

栗子:

import copy

n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n4 = copy.deepcopy(n1)  # 深拷贝
print("第一层字典的内存地址:")
print(id(n1))
print(id(n4))
print("第二层嵌套的列表的内存地址:")
print(id(n1["k3"]))
print(id(n4["k3"]))
n1['k1'] = 'tom'
n1['k3'][0] = 'jack'
print(n1,n4)

输出结果:
{'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
第一层字典的内存地址:
1853270748616
1853271588800
第二层嵌套的列表的内存地址:
1853273351880
1853273350600
***************
{'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}

  通过以上结果发现,进行深拷贝时,字典里面的第一层和里面嵌套的地址都已经变了。对于深拷贝,它会拷贝多层,将第二层的列表也拷贝一份,如果还有第三层嵌套,那么第三层的也会拷贝,但是对于里面的最小元素,比如数字和字符串,这里就是“wu”,123,“alex”,678之类的,按照python的机制,它们会共同指向同一个位置,它的内存地址是不会变的。原理如下图:

 结论:对于深拷贝,字典、列表等类型,它里面嵌套多少层,就会拷贝多少层出来,但是最底层的数字和字符串地址不变,是一样的。

PS:

  对于元祖来说,如果他里面的元素都是不可变类型的元素,那么不论是赋值,浅拷贝还是深拷贝,他们的id都是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的)。但是如果元祖里面的元素有可变元素,如列表字典等,那么对于赋值和浅拷贝来说,id仍然还是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的);对于深拷贝来说,元祖的id和列表字典的id是不一样的,但是对于最底层的数字,字符串地址还是一样的。

原文地址:https://www.cnblogs.com/wusir66/p/10092299.html