一尘不染

如何在python中实现良好的__hash__函数

python

当实现具有多个属性的类时(例如下面的玩具示例),处理哈希的最佳方法是什么?

我认为__eq____hash__应该是一致的,但是如何实现能够处理所有属性的适当的哈希函数呢?

class AClass:
  def __init__(self):
      self.a = None
      self.b = None

  def __eq__(self, other):
      return other and self.a == other.a and self.b == other.b

  def __ne__(self, other):
    return not self.__eq__(other)

  def __hash__(self):
      return hash((self.a, self.b))

阅读 177

收藏
2020-12-20

共1个答案

一尘不染

__hash__对于相等的对象应返回相同的值。它也不应在对象的整个生命周期内发生变化。通常,您只为不可变的对象实现它。

一个简单的实现就是公正return 0。这始终是正确的,但效果很差。

您的解决方案,返回一个属性元组的哈希,是很好的。但是请注意,您无需列出__eq__在元组中进行比较的所有属性。如果某些属性对于不相等的对象通常具有相同的值,则将其省略。不要使散列计算的成本超出其所需的成本。

编辑:我建议一般不要使用xor混合哈希。当两个不同的属性具有相同的值时,它们将具有相同的哈希值,并且通过xor进行相互抵消。元组使用更复杂的计算来混合哈希,请参见tuplehash中的tupleobject.c

2020-12-20