登录
首页 >  文章 >  python教程

Python字典列表排序技巧详解

时间:2025-10-10 23:07:33 490浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《Python字典列表排序全攻略》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

使用sorted()函数配合key参数和lambda表达式可轻松对字典列表排序,支持单键、多键、升降序及缺失值处理,且Python排序稳定,能保持相同键值元素的相对顺序。

如何对字典列表进行排序?

说起来,给一堆字典排个序,这事儿在Python里其实挺顺手的。核心思路就是用那个sorted()函数,然后关键在于给它一个key参数,告诉它你到底想拿字典里的哪个值来比大小。通常我们都会甩个lambda表达式过去,简单粗暴又好用,几行代码就能搞定。

解决方案

要对字典列表进行排序,最直接且推荐的方法就是使用Python内置的sorted()函数。这个函数会返回一个新的、已排序的列表,而不会修改原始列表。它的强大之处在于可以接受一个key参数,这个参数是一个函数,用于从列表的每个元素中提取一个比较键。

我们通常会用lambda表达式来作为这个key函数,因为它非常简洁,能直接指定字典中哪个键的值作为排序依据。

举个例子,假设我们有一个存储了学生信息的字典列表:

students = [
    {'name': '张三', 'age': 20, 'score': 85},
    {'name': '李四', 'age': 22, 'score': 92},
    {'name': '王五', 'age': 20, 'score': 78},
    {'name': '赵六', 'age': 21, 'score': 92}
]

如果我想根据学生的年龄(age)来排序,可以这样做:

# 按年龄升序排序
sorted_by_age = sorted(students, key=lambda student: student['age'])
print("按年龄升序排序:")
for s in sorted_by_age:
    print(s)

# 如果我想按分数降序排序,可以加上 reverse=True 参数
sorted_by_score_desc = sorted(students, key=lambda student: student['score'], reverse=True)
print("\n按分数降序排序:")
for s in sorted_by_score_desc:
    print(s)

这里,lambda student: student['age'] 就是那个关键。它告诉sorted()函数,对于列表中的每个student字典,都取出它的'age'值来作为排序的依据。reverse=True则简单地把排序结果反转过来,实现降序排列。

除了sorted()函数,如果你想直接修改原始列表而不是创建一个新列表,也可以使用列表自己的sort()方法。它的用法和sorted()非常相似:

# 直接在原列表上按姓名升序排序
students.sort(key=lambda student: student['name'])
print("\n原列表按姓名升序排序后:")
for s in students:
    print(s)

需要注意的是,list.sort()会返回None,所以不要尝试将它的结果赋值给一个新变量,那样会得到一个空值。

如何按多个键对字典列表进行排序?

在实际场景中,我们经常会遇到需要根据多个条件来排序的情况,比如先按年龄排,年龄相同的再按分数排。Python的sorted()函数(以及list.sort()方法)在处理这种多重排序时表现得非常优雅。

秘诀在于,你的key函数可以返回一个元组(tuple)。Python在比较元组时,会从左到右逐个元素进行比较。这意味着元组中的第一个元素是主排序依据,第二个元素是次要依据,以此类推。

还是用之前的学生列表为例。如果我想先按年龄升序排序,年龄相同的学生再按分数降序排序,可以这样写:

students = [
    {'name': '张三', 'age': 20, 'score': 85},
    {'name': '李四', 'age': 22, 'score': 92},
    {'name': '王五', 'age': 20, 'score': 78},
    {'name': '赵六', 'age': 21, 'score': 92}
]

# 先按年龄升序,年龄相同的按分数降序
# 注意:分数降序需要在key中对分数取负值,因为sorted默认是升序
sorted_multi_key = sorted(students, key=lambda s: (s['age'], -s['score']))
print("按年龄升序,分数降序排序:")
for s in sorted_multi_key:
    print(s)

这里key=lambda s: (s['age'], -s['score'])就是关键。它返回一个包含两个元素的元组:学生的年龄和分数的负值。sorted()会先比较年龄,如果年龄相同,就会比较分数的负值。因为负数是越小实际值越大,所以通过取负值,我们巧妙地实现了分数的降序排列。这种技巧在需要混合升序和降序的多重排序时非常实用。

排序时如何处理缺失的键?

在处理真实世界的数据时,字典中的键可能并不总是完整的,有些字典可能缺少我们想要用来排序的键。如果直接访问一个不存在的键(例如student['age']),Python会抛出KeyError,导致程序崩溃。

为了避免这种情况,我们可以利用字典的get()方法。get()方法允许你指定一个默认值,当键不存在时,它会返回这个默认值而不是抛出错误。

例如,如果我们的学生列表中有些字典可能没有'score'键:

students_with_missing_data = [
    {'name': '张三', 'age': 20, 'score': 85},
    {'name': '李四', 'age': 22}, # 缺少分数
    {'name': '王五', 'age': 20, 'score': 78},
    {'name': '赵六', 'age': 21, 'score': 92},
    {'name': '钱七', 'age': 19} # 缺少分数
]

如果我们要按分数排序,但有些学生没有分数,我们可以给这些缺失分数的学生一个默认值,比如0分,或者一个非常小(或大)的值,这取决于你希望它们在排序中处于什么位置。

# 按分数升序排序,缺失分数的学生默认为0分
sorted_missing_score = sorted(students_with_missing_data, key=lambda s: s.get('score', 0))
print("处理缺失分数(默认为0)后按分数升序排序:")
for s in sorted_missing_score:
    print(s)

# 如果你希望缺失分数的学生排在最后,可以给一个非常大的默认值
# 比如 float('inf'),或者一个你确定不会出现的分数上限
sorted_missing_score_at_end = sorted(students_with_missing_data, key=lambda s: s.get('score', float('inf')))
print("\n处理缺失分数(排在最后)后按分数升序排序:")
for s in sorted_missing_score_at_end:
    print(s)

通过s.get('score', 0),当'score'键不存在时,sorted()函数会使用0作为该字典的排序依据。这样既避免了错误,又能灵活控制缺失数据的排序位置。选择合适的默认值非常重要,它直接影响了排序结果的逻辑。

对字典列表进行排序时,Python的稳定性体现在哪里?

在谈论排序算法时,“稳定性”是一个非常重要的概念,尤其是在处理复杂数据结构如字典列表时。简单来说,一个“稳定”的排序算法意味着,如果两个元素具有相同的排序键值,它们在排序后的相对顺序会保持不变,和它们在原始列表中的顺序一致。

Python的内置排序功能(sorted()函数和list.sort()方法)是稳定的。这是因为它们底层使用的是Timsort算法,Timsort是一种混合排序算法,它结合了归并排序(Merge Sort)和插入排序(Insertion Sort),并且它被设计成是稳定的。

为什么稳定性很重要呢?考虑以下场景:

你有一个学生列表,你首先想按他们的入学年份排序,然后,对于同一年入学的学生,你又想按他们的姓氏字母顺序排序。

students_stable = [
    {'name': '王五', 'year': 2020, 'id': 'A003'},
    {'name': '李四', 'year': 2021, 'id': 'A002'},
    {'name': '张三', 'year': 2020, 'id': 'A001'},
    {'name': '赵六', 'year': 2021, 'id': 'A004'}
]

# 第一次排序:按ID升序(作为初始相对顺序)
# 假设ID代表了他们进入系统的时间,我们想保留这个信息
sorted_by_id = sorted(students_stable, key=lambda s: s['id'])
print("初始按ID排序:")
for s in sorted_by_id:
    print(s)
# 结果:张三(A001), 李四(A002), 王五(A003), 赵六(A004)

# 第二次排序:在第一次排序的基础上,按年份升序
# 注意这里我们是对 sorted_by_id 进行排序,而不是原始列表
sorted_by_year_then_id = sorted(sorted_by_id, key=lambda s: s['year'])
print("\n再次按年份排序(稳定性体现):")
for s in sorted_by_year_then_id:
    print(s)

观察上面的例子,在按ID排序后,张三王五之前(因为A001在A003之前)。当再次按year排序时,张三王五都是2020年入学。由于Python排序的稳定性,张三仍然会保持在王五之前,因为他们在第一次排序后就建立了这种相对顺序,并且在第二次排序中,他们的year值相同,稳定排序不会改变他们之间的相对位置。

这种特性在分阶段排序、或者当你的数据中存在大量具有相同排序键值的元素时尤其有用。它确保了额外的排序操作不会无意中打乱那些不应该被改变的相对顺序,这让数据处理的逻辑变得更加可预测和可靠。

终于介绍完啦!小伙伴们,这篇关于《Python字典列表排序技巧详解》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>