Python数组交集:set与双指针对比解析
时间:2026-03-15 22:09:44 327浏览 收藏
本文深入对比了Python中求数组交集的两种主流方法——基于哈希表的set操作与适用于有序数组的双指针法:set方案简洁高效、时间复杂度约O(n+m),适合无需保序和去重的常规场景,但会丢失原始顺序与元素频次;双指针法则在输入已排序的前提下,以O(1)额外空间实现保序输出和精准重复控制,是处理如LeetCode 350等频次敏感问题的不二之选。最终选择不应只看性能,而应紧扣三大实际约束——输入是否已排序、是否需保留重复、以及内存与开发效率的权衡,避开“未排序硬用双指针”或“需频次却用set”等高频陷阱。

用 set() 求交集快不快?看场景
绝大多数情况下,set(nums1) & set(nums2) 是最简、最快的选择——前提是不关心顺序、不保留重复元素、且数组不是超大(比如上亿元素)。
Python 的 set 底层是哈希表,求交集时间复杂度接近 O(min(len(nums1), len(nums2))),但建集合本身要遍历一次数组,总开销约 O(n + m)。内存会多占一份去重后的副本。
常见错误现象:list(set(nums1) & set(nums2)) 返回结果顺序不定;如果原数组有重复值(如 [1,1,2] 和 [1,2,2]),交集只留一个 1 和一个 2,丢失频次信息。
- 需要去重 + 无视顺序 → 直接用
set最省事 - 输入已排序,且想保持升序输出 →
set会打乱顺序,不如双指针 - 内存敏感(如嵌入式或流式处理)→
set额外占内存,慎用
双指针法适合什么情况?
当两个数组都已排序,且你要求结果也有序、或需保留重复逻辑(比如“每个元素在交集中出现次数 = 两数组中该元素最小出现次数”),双指针是更精准的解法。
它不依赖哈希,空间复杂度仅 O(1)(不算输出列表),遍历过程天然保序,还能灵活控制重复行为。
典型使用场景:LeetCode 350 “两个数组的交集 II”,要求返回带重复的交集;或者你在处理数据库分页结果、时间序列对齐等已排好序的数据流。
- 两数组必须事先升序排列,否则指针移动会漏匹配
- 边界判断容易错:任一指针越界就得停,别写成
while i 后还继续访问nums1[i] - 重复处理逻辑要明确:遇到相等时 append 后,两个指针都进一;不等时只动小数那边的指针
set.intersection() 和 & 有区别吗?
没实质区别。set1 & set2 是运算符语法糖,底层调用的就是 set1.intersection(set2)。但注意:后者支持多个参数,比如 set1.intersection(set2, set3, set4),而 & 只能两两连用(set1 & set2 & set3 也行,但本质还是左结合)。
性能上几乎无差异,Cython 层都走同一套逻辑。不过 intersection() 支持传入任意可迭代对象(比如 set1.intersection([1,2,3])),而 & 要求右边也得是 set 类型,否则报 TypeError: unsupported operand type(s)。
- 想一行写多个集合交集 → 用
.intersection()更直白 - 右边可能是 list/tuple 且不想显式转 set → 只能用
.intersection() - 做类型检查或 lint 报警时,有些工具对运算符重载提示较弱,用方法名更易追踪
实际选哪个?关键看这三点
别纠结“哪个更高级”,就盯住输入特征和输出需求:
- 输入是否已排序?是 → 优先双指针;否 →
set省心 - 是否要保留重复?是 → 双指针可精确控频次;
set天然去重,绕不开 - 内存 or 速度优先?大数据量且内存紧 → 双指针;中小数据且写快为主 →
set
最容易被忽略的是:很多人直接对未排序数组硬套双指针,结果逻辑全错;或者在需要频次的题里盲目用 set,提交后发现用例过不了。顺序和重复性这两个约束,比“哪个快”重要得多。
到这里,我们也就讲完了《Python数组交集:set与双指针对比解析》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
362 收藏
-
413 收藏
-
260 收藏
-
181 收藏
-
500 收藏
-
478 收藏
-
258 收藏
-
399 收藏
-
488 收藏
-
177 收藏
-
413 收藏
-
450 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习