首页 > 文章 > python教程

Python三层嵌套字典去重技巧

时间：2025-04-12 16:43:26 432浏览收藏

本文介绍了Python中高效删除三层嵌套字典中值完全相同的键的技巧。针对字典`dict1={'l1':{'pop1':{'a':1}, 'pop2':{'a':1}, 'pop3':{'a':1}}, 'l2':{...}, 'l3':{...}}`，目标是删除最外层字典中所有最内层字典值完全相同的键（例如'l1'）。文章提供了一种优化方案，利用`json.dumps()`将字典值转换为可哈希字符串，再用`set()`高效地判断唯一性，从而避免了低效的`all()`函数和重复比较，显著提升了处理大型嵌套字典的效率，最终得到`dict2={'l2':{...}, 'l3':{...}}`。该方法简洁易懂，易于维护，是处理此类问题的最佳实践。

如何在Python中删除三层嵌套字典中最内层值完全相同的键？

Python三层嵌套字典键值删除：高效解决方案

本文探讨如何处理Python中三层嵌套字典的键值删除问题。目标是删除最外层字典中，其对应的最内层字典值完全相同的键。

问题描述

给定一个三层嵌套字典，例如：

dict1 = {'l1':{'pop1':{'a':1}, 'pop2':{'a':1}, 'pop3':{'a':1}},
         'l2':{'pop1':{'b':1}, 'pop2':{'b':1}, 'pop3':{'b':2}},
         'l3':{'pop1':{'c':1}, 'pop2':{'c':2}, 'pop3':{'c':3}}}

需要删除最内层字典值完全相同的键（例如'l1'），得到：

dict2 = {'l2':{'pop1':{'b':1}, 'pop2':{'b':1}, 'pop3':{'b':2}},
         'l3':{'pop1':{'c':1}, 'pop2':{'c':2}, 'pop3':{'c':3}}}

优化后的解决方案

直接使用all()函数检查字典值是否相同效率较低，特别是对于大型字典。以下代码提供一个更优化的解决方案，利用json.dumps()将字典转换为可哈希的字符串进行比较：

import json

def remove_replicated(o_d):
    d_c = o_d.copy()  # 创建副本避免修改原字典
    keys_to_remove = set()

    for k, v in d_c.items():
        inner_values = [json.dumps(inner_v) for inner_v in v.values()]  # 转换为可哈希字符串
        if len(set(inner_values)) == 1:  # 使用集合判断唯一性，效率更高
            keys_to_remove.add(k)

    for k in keys_to_remove:
        del o_d[k]

# 使用示例
dict1 = {'l1':{'pop1':{'a':1}, 'pop2':{'a':1}, 'pop3':{'a':1}},
         'l2':{'pop1':{'b':1}, 'pop2':{'b':1}, 'pop3':{'b':2}},
         'l3':{'pop1':{'c':1}, 'pop2':{'c':2}, 'pop3':{'c':3}}}

remove_replicated(dict1)
print(dict1)

此方法首先将最内层字典的值转换为可哈希的JSON字符串，然后使用集合set()高效地检查唯一性。这避免了重复的比较，显著提高了效率，尤其是在处理大型嵌套字典时。使用集合判断唯一性比all()效率更高。此外，代码也更简洁易懂。

此优化后的函数remove_replicated在处理大量数据时性能会更好，并且代码更清晰、更易于维护。

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~