首页 > 文章 > python教程

Python自定义比较方法全解析

时间：2026-02-22 08:36:47 294浏览收藏

本文深入剖析了Python中自定义对象比较与哈希行为的关键规则与常见陷阱，重点强调__eq__与__hash__必须严格同步：重写__eq__却忽略__hash__会导致对象不可哈希，引发set或dict使用时的TypeError；而__hash__的实现必须确保“相等即同哈希”，否则将破坏容器底层逻辑——若参与比较的字段全为不可变类型，应显式基于元组返回一致哈希值；若含可变字段，则应让__hash__保持为None（而非手动赋值None或调用object.__hash__）以保障安全；同时提醒__lt__等富比较方法不可孤立实现，需配合functools.total_ordering或补全全部方法才能获得完整比较能力。

Python 自定义比较方法的正确姿势

eq 和 hash 必须同步修改

Python 对象默认用 id() 做比较和哈希，一旦你重写了 __eq__ 却没动 __hash__，对象就自动变成不可哈希的——放进 set 或当 dict 键时直接报 TypeError: unhashable type。

常见错误是只改 __eq__，以为“相等逻辑对了就行”。但 Python 规定：如果两个对象 __eq__ 返回 True，它们的 __hash__ **必须相同**；反之不成立。违反就破坏字典/集合底层逻辑。

若逻辑上支持哈希（比如所有用于比较的字段都不可变），显式定义 __hash__ = lambda self: hash((self.a, self.b))
若用了可变字段（如 list、dict）参与比较，别写 __hash__，让它是 None——这是安全的默认行为
别写 __hash__ = None，那会彻底禁用哈希；也不要用 object.__hash__，它仍基于 id，和你的 __eq__ 冲突

lt 等比较方法不能只补一个

只实现 __lt__ 并不能让 a 或 sorted() 正常工作。Python 不会自动推导其他关系，sorted() 默认调用 __lt__，但 a 实际调用的是 __le__，不存在就回退到 __gt__ 取反——结果往往错得离谱。

真正省事又可靠的做法是用 @functools.total_ordering 装饰器：

from functools import total_ordering

@total_ordering
class Version:
    def __init__(self, major, minor):
        self.major = major
        self.minor = minor
    def __eq__(self, other):
        return (self.major, self.minor) == (other.major, other.minor)
    def __lt__(self, other):
        return (self.major, self.minor) 
<p>它会自动生成 <code>__le__</code>、<code>__gt__</code>、<code>__ge__</code>，前提是至少定义了 <code>__eq__</code> 和其中一个大小关系（如 <code>__lt__</code>）。</p>

<h3>dataclass 的 eq=True 是表层糖，别当真</h3>
<p><code>@dataclass(eq=True)</code> 自动生成 <code>__eq__</code>，看起来省事，但它只按字段值逐个比较，不处理嵌套可变对象、浮点精度、NaN、或业务上的“逻辑相等”（比如忽略空格、大小写）。</p>
<p>典型翻车场景：</p>

字段含 list 或 dict：内容相同但对象不同，== 仍为 True（深比较没问题），但若字段里存了自定义类且没实现 __eq__，就直接比 id，结果不可控
用 float 字段：0.1 + 0.2 != 0.3，生成的 __eq__ 会暴露这个坑
想让 name="Alice " 和 name="Alice" 相等？必须手动重写 __eq__，dataclass 不管这层语义