当实现具有多个属性的类时(例如下面的玩具示例),处理哈希的最佳方法是什么?
我认为__eq__和__hash__应该是一致的,但是如何实现能够处理所有属性的适当的哈希函数呢?
__eq__
__hash__
class AClass: def __init__(self): self.a = None self.b = None def __eq__(self, other): return other and self.a == other.a and self.b == other.b def __ne__(self, other): return not self.__eq__(other) def __hash__(self): return hash((self.a, self.b))
__hash__对于相等的对象应返回相同的值。它也不应在对象的整个生命周期内发生变化。通常,您只为不可变的对象实现它。
一个简单的实现就是公正return 0。这始终是正确的,但效果很差。
return 0
您的解决方案,返回一个属性元组的哈希,是很好的。但是请注意,您无需列出__eq__在元组中进行比较的所有属性。如果某些属性对于不相等的对象通常具有相同的值,则将其省略。不要使散列计算的成本超出其所需的成本。
编辑:我建议一般不要使用xor混合哈希。当两个不同的属性具有相同的值时,它们将具有相同的哈希值,并且通过xor进行相互抵消。元组使用更复杂的计算来混合哈希,请参见tuplehash中的tupleobject.c。
tuplehash
tupleobject.c