首页 > 文章 > python教程

Pythoncollections模块是什么？常用数据结构有哪些

时间：2025-06-26 13:33:26 240浏览收藏

在IT行业这个发展更新速度很快的行业，只有不停止的学习，才不会被行业所淘汰。如果你是文章学习者，那么本文《Python collections模块是什么？常用数据结构有哪些》就很适合你！本篇内容主要包括##content_title##，希望对大家的知识积累有所帮助，助力实战开发！

collections模块提供了高效的专业数据结构适用于特定场景。1.Counter用于数据统计，如元素计数；2.defaultdict为字典提供默认值避免KeyError；3.deque实现高效的双端队列操作；4.namedtuple增强元组的可读性；5.OrderedDict保持字典键的插入顺序。这些结构在数据统计分析、缓存实现、任务调度、数据结构设计及配置管理中尤为有用。选择时应根据具体需求如计数、默认值处理、两端操作效率、可读性和顺序保持等进行判断。

Python中的collections模块是什么 collections模块提供了哪些常用数据结构

Python的collections模块，简单来说，就是一个扩展的容器数据类型模块。它在Python内建的dict、list、set和tuple的基础上，提供了更加专业、高效的数据结构，解决特定场景下的问题。你可能觉得用处不大，但一旦遇到合适的场景，它能让你少写很多代码，而且性能往往更好。

Counter、defaultdict、deque、namedtuple、OrderedDict，这些都是collections模块里的宝贝。

Counter：统计利器，快速计数

如果让你统计一个列表中每个元素出现的次数，你会怎么做？传统的做法可能要用一个字典，循环遍历列表，判断元素是否在字典中，不在就添加，在就计数加一。代码不少，而且效率也不一定高。

from collections import Counter

my_list = ['a', 'b', 'a', 'c', 'b', 'b']
element_counts = Counter(my_list)
print(element_counts) # 输出：Counter({'b': 3, 'a': 2, 'c': 1})

一行代码搞定！ Counter 会自动统计列表中每个元素的出现次数，并返回一个类似字典的对象，其中键是元素，值是计数。而且，它还提供了一些方便的方法，比如 most_common() 可以返回出现次数最多的元素。

defaultdict：字典的默认值救星

字典的一个常见问题是，当你尝试访问一个不存在的键时，会抛出 KeyError 异常。为了避免这种情况，你可能需要先判断键是否存在，或者使用 try-except 语句。defaultdict 可以帮你优雅地解决这个问题。

from collections import defaultdict

# 使用 list 作为默认工厂
my_dict = defaultdict(list)
my_dict['a'].append(1)
my_dict['b'].append(2)
my_dict['a'].append(3)
print(my_dict) # 输出：defaultdict(, {'a': [1, 3], 'b': [2]})

# 访问不存在的键，不会抛出 KeyError，而是返回一个空列表
print(my_dict['c']) # 输出：[]

defaultdict 接受一个函数作为参数，这个函数被称为默认工厂。当访问一个不存在的键时，defaultdict 会自动调用这个工厂函数，生成一个默认值，并将其赋值给这个键。上面的例子中，我们使用 list 作为默认工厂，所以当访问不存在的键时，会返回一个空列表。

deque：高效的双端队列

deque (double-ended queue) 是一种双端队列，可以在队列的两端高效地添加和删除元素。相比于Python内置的 list，deque 在两端操作的性能更好，因为 list 在头部插入或删除元素时，需要移动后面的所有元素。

from collections import deque

my_deque = deque([1, 2, 3])
my_deque.append(4) # 在尾部添加元素
my_deque.appendleft(0) # 在头部添加元素
print(my_deque) # 输出：deque([0, 1, 2, 3, 4])

my_deque.pop() # 从尾部删除元素
my_deque.popleft() # 从头部删除元素
print(my_deque) # 输出：deque([1, 2, 3])

deque 特别适合用于实现队列和栈等数据结构，以及需要频繁在两端操作的场景。

namedtuple：让元组更具可读性

元组是一种不可变的序列，通常用于存储一组相关的数据。但是，元组的元素只能通过索引访问，这使得代码的可读性较差。namedtuple 可以让你给元组的每个元素命名，从而提高代码的可读性。

from collections import namedtuple

# 定义一个 namedtuple 类型 Point
Point = namedtuple('Point', ['x', 'y'])

# 创建一个 Point 对象
p = Point(10, 20)

# 通过属性名访问元素
print(p.x) # 输出：10
print(p.y) # 输出：20

# 仍然可以通过索引访问元素
print(p[0]) # 输出：10
print(p[1]) # 输出：20

namedtuple 实际上是一个类，它继承自 tuple。你可以像访问类的属性一样访问元组的元素，这使得代码更加清晰易懂。

OrderedDict：记住插入顺序的字典

Python 3.7+ 的字典已经默认保持插入顺序了，但在之前的版本中，字典是无序的。如果你需要在旧版本中使用有序字典，或者需要明确地保证字典的插入顺序，可以使用 OrderedDict。

from collections import OrderedDict

my_dict = OrderedDict()
my_dict['a'] = 1
my_dict['b'] = 2
my_dict['c'] = 3

for key, value in my_dict.items():
    print(key, value) # 输出：a 1  b 2  c 3

OrderedDict 会记住键的插入顺序，并按照这个顺序迭代字典的元素。

collections模块中的数据结构在哪些场景下特别有用？

数据统计和分析： Counter 非常适合用于统计各种数据的出现次数，例如单词计数、用户行为分析等。
缓存： OrderedDict 可以用于实现 LRU (Least Recently Used) 缓存，当缓存达到最大容量时，可以删除最久未使用的元素。
任务调度： deque 可以用于实现任务队列，可以高效地添加和删除任务。
数据结构设计： deque 可以用于实现栈、队列等基本数据结构。namedtuple 可以用于定义简单的数据结构，提高代码的可读性。
配置管理： namedtuple 可以用于存储配置信息，例如数据库连接信息、API 密钥等。

如何选择合适的数据结构？

选择合适的数据结构取决于具体的应用场景和需求。

如果需要统计数据的出现次数， 优先考虑 Counter。
如果需要一个默认值的字典， 优先考虑 defaultdict。
如果需要在两端高效地添加和删除元素， 优先考虑 deque。
如果需要提高元组的可读性， 优先考虑 namedtuple。
如果需要保持字典的插入顺序， 优先考虑 OrderedDict (或者使用 Python 3.7+ 的普通字典)。

collections模块还有哪些不常用的数据结构？

除了上面介绍的几种常用的数据结构，collections 模块还提供了一些不太常用的数据结构，例如：

ChainMap： 将多个字典或映射组合成一个逻辑单元，用于查找值。
UserDict、UserList、UserString： 用于创建自定义的字典、列表和字符串类。

这些数据结构在特定的场景下也可能很有用，但使用频率相对较低。

本篇关于《Pythoncollections模块是什么？常用数据结构有哪些》的介绍就到此结束啦，但是学无止境，想要了解学习更多关于文章的相关知识，请关注golang学习网公众号！

数据结构