Python深浅拷贝区别全解析
时间:2025-09-21 09:40:02 254浏览 收藏
本篇文章给大家分享《Python深拷贝与浅拷贝区别详解》,覆盖了文章的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。
深拷贝和浅拷贝的核心区别在于对嵌套可变对象的处理:浅拷贝只复制顶层对象,嵌套对象仍共享引用,修改副本会影响原对象;深拷贝则递归复制所有层级,创建完全独立的对象。选择取决于数据结构是否包含可变嵌套对象及是否需要完全隔离。
Python里的深拷贝和浅拷贝,说白了,就是复制对象时,对嵌套对象处理方式的不同。浅拷贝只复制对象本身,嵌套对象还是引用原来的;深拷贝则是把所有嵌套对象也一并复制过来,完全独立。理解这个,你才能避免很多意想不到的坑。
解决方案
在我刚开始接触Python的时候,=
赋值操作符带来的“惊喜”就让我印象深刻,它其实是引用,不是复制。后来发现还有 copy
模块提供的浅拷贝和深拷贝,这一下子就打开了新世界的大门,但也带来了新的困惑。
浅拷贝,简单来说,就是“复制一层”。它会创建一个新对象,然后将原始对象中的内容(比如列表中的元素、字典中的键值对)的引用复制到新对象中。如果这些内容是不可变对象(比如数字、字符串、元组),那没啥问题,因为它们本身就不会变。但如果内容是可变对象(比如列表、字典、集合),那新旧对象就会共享这些可变内容的引用。这意味着,你修改新对象中的某个嵌套列表,原对象中的那个列表也会跟着变,反之亦然。这就像你复印了一份文件,但文件里夹着一张便签,你改了便签,原文件里的便签也跟着变了。
深拷贝就不同了,它是“递归复制”。它不仅复制了对象本身,还会递归地复制对象内部所有嵌套的可变对象。它会努力创建一个完全独立的新对象,新对象和原始对象之间没有任何共享的引用。这意味着,无论你修改新对象中的哪个部分,都不会影响到原始对象,它们是两个完全独立的个体。这就像你复印了一份文件,文件里的所有内容,包括那张便签,都重新手写了一份,完全独立。当然,这个过程会更耗费时间和内存,因为它需要遍历整个对象结构。
所以,核心在于,你的对象结构里有没有可变对象,以及你是否希望修改副本时影响到原件。
Python浅拷贝是如何处理嵌套对象的?
浅拷贝在Python中通常通过 list()
、dict()
、set()
等构造函数,或者 [::]
切片操作,以及 copy
模块的 copy.copy()
函数来实现。它的工作机制是这样的:当你对一个包含嵌套可变对象的对象进行浅拷贝时,它会为顶层对象创建一个全新的内存空间。然而,对于顶层对象内部引用的那些子对象(尤其是列表、字典这类可变对象),它不会为它们创建新的内存空间,而是直接复制它们的引用。
举个例子:
import copy original_list = [1, [2, 3], 4] shallow_copied_list = copy.copy(original_list) print(f"原始列表ID: {id(original_list)}") print(f"浅拷贝列表ID: {id(shallow_copied_list)}") print(f"原始列表嵌套子列表ID: {id(original_list[1])}") print(f"浅拷贝列表嵌套子列表ID: {id(shallow_copied_list[1])}") # 修改浅拷贝列表中的嵌套子列表 shallow_copied_list[1].append(5) print(f"修改后原始列表: {original_list}") print(f"修改后浅拷贝列表: {shallow_copied_list}")
运行这段代码,你会发现 original_list
和 shallow_copied_list
的ID是不同的,说明它们是两个不同的顶层列表。但是,original_list[1]
和 shallow_copied_list[1]
的ID却是相同的!这就意味着它们指向的是同一个内存地址的同一个子列表。所以,当你通过 shallow_copied_list[1].append(5)
修改子列表时,original_list
里的子列表也跟着变了。
这种行为在处理一些简单数据结构时可能无伤大雅,甚至能节省内存。但一旦你的数据结构变得复杂,包含多层嵌套的可变对象,浅拷贝就很容易埋下隐患,导致数据被意外修改,排查起来还挺让人头疼的。我个人就遇到过好几次因为没搞清楚这个,结果导致数据在不该变的地方变了,调试了半天才发现是浅拷贝的锅。
Python深拷贝是如何确保对象完全独立的?
深拷贝,顾名思义,就是要“深挖到底”,确保复制出来的对象与原对象之间没有任何共享的引用。这通常通过 copy
模块的 copy.deepcopy()
函数来实现。它的核心机制是递归地遍历原始对象的所有层级,遇到任何可变对象,都会为它创建一个全新的副本,而不是简单地复制引用。
我们继续用之前的例子,看看深拷贝的表现:
import copy original_list = [1, [2, 3], 4] deep_copied_list = copy.deepcopy(original_list) print(f"原始列表ID: {id(original_list)}") print(f"深拷贝列表ID: {id(deep_copied_list)}") print(f"原始列表嵌套子列表ID: {id(original_list[1])}") print(f"深拷贝列表嵌套子列表ID: {id(deep_copied_list[1])}") # 修改深拷贝列表中的嵌套子列表 deep_copied_list[1].append(5) print(f"修改后原始列表: {original_list}") print(f"修改后深拷贝列表: {deep_copied_list}")
这次你会发现,original_list
和 deep_copied_list
的ID不同,original_list[1]
和 deep_copied_list[1]
的ID也不同了!这明确地告诉我们,深拷贝不仅复制了顶层列表,连它内部的嵌套子列表也一并复制了一份,生成了一个全新的、独立的子列表。所以,当你修改 deep_copied_list[1]
时,original_list
保持不变,它们彻底解耦了。
深拷贝的这种彻底性,在处理需要完全隔离的数据副本时非常有用,比如在函数中需要修改传入的列表而不影响原始列表,或者在多线程环境中避免数据竞争。但它也有缺点,因为它需要递归遍历整个对象结构,对于非常大或复杂的对象,深拷贝可能会消耗更多的内存和CPU时间。而且,如果对象中包含循环引用(比如一个对象引用了另一个对象,而那个对象又引用了第一个对象),deepcopy()
也能正确处理,避免无限递归,这背后其实也挺考验设计功力的。
什么时候选择深拷贝,什么时候选择浅拷贝?
选择深拷贝还是浅拷贝,这事儿没有绝对的对错,关键在于你的具体需求和数据结构。
选择浅拷贝的情况:
- 对象只包含不可变数据类型: 如果你的列表或字典里只有数字、字符串、元组这类不可变对象,那么浅拷贝和深拷贝的效果其实是一样的,因为不可变对象本身就不能被修改。这种情况下,用浅拷贝更高效。
- 只关心顶层对象的独立性: 你只希望复制出来的对象和原对象在顶层是独立的,而内部的嵌套对象是否共享引用并不重要,或者你确定不会修改那些共享的嵌套对象。
- 性能敏感的场景: 对于非常大的数据结构,如果不需要完全独立的副本,浅拷贝通常会更快,占用更少的内存。
- 有意共享内部对象: 有时候,你可能就是希望新旧对象共享某些内部结构,例如,一个配置字典,你复制它只是想在顶层添加一些新配置,但底层的默认配置项希望继续共享,避免重复存储。
选择深拷贝的情况:
- 对象包含可变嵌套对象,且你需要完全独立的副本: 这是最常见的场景。比如,你有一个复杂的配置字典,里面嵌套了列表和字典,你希望在不影响原始配置的情况下,对副本进行任意修改。
- 避免副作用: 当你将一个对象作为参数传递给函数,并且函数内部可能会修改这个对象时,如果不想影响到函数外部的原始对象,传入深拷贝的副本是最佳实践。
- 数据隔离与快照: 在需要创建数据快照、历史版本或者在多线程/多进程环境中,为了确保数据不被意外修改,深拷贝是保证数据隔离的有效手段。
- 处理复杂对象结构: 比如树形结构、图结构等,它们通常包含多层嵌套和相互引用,深拷贝能确保复制出完整的、独立的结构。
我个人的经验是,如果你不确定,或者数据结构比较复杂,倾向于使用深拷贝。虽然它可能带来一些性能开销,但能避免很多难以追踪的bug。在确认性能确实成为瓶颈,并且你完全理解浅拷贝的副作用时,再考虑使用浅拷贝。毕竟,代码的健壮性和可维护性,有时候比极致的性能更重要。理解这两种拷贝机制,是写出可靠Python代码的基础之一。
终于介绍完啦!小伙伴们,这篇关于《Python深浅拷贝区别全解析》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
298 收藏
-
385 收藏
-
237 收藏
-
124 收藏
-
495 收藏
-
425 收藏
-
245 收藏
-
109 收藏
-
307 收藏
-
179 收藏
-
368 收藏
-
493 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 499次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习