一尘不染

为什么Hashtable 11的initialCapacity为HashMap,而HashMap中的DEFAULT_INITIAL_CAPACITY为16并要求2的幂?

java

比较JDK 1.6中的HashMapHashtable源代码,我在HashMap中看到以下代码:

/**
 * The default initial capacity - MUST be a power of two.
 */
static final int DEFAULT_INITIAL_CAPACITY = 16;

    int capacity = 1;
    while (capacity < initialCapacity)
        capacity <<= 1;

但是,在Hashtable中,我看到了以下内容:

table = new Entry[initialCapacity];

public Hashtable() {
    this(11, 0.75f);
}

所以我的问题是:为什么HashMap需要2的幂作为初始容量,而Hashtable选择11作为默认初始容量?我认为这与Hashtable是线程安全的并且不允许空键或值无关。


阅读 568

收藏
2020-12-03

共1个答案

一尘不染

以下文章详细地解决了这个问题:HashMap需要更好的hashCode()-JDK
1.4 Part II

根据那篇文章,转换为2的幂的主要原因是位掩码比整数除法快。这并非没有不利后果,其中一位原始作者对此进行了解释:

Joshua Bloch
:使用2的幂的缺点是,生成的哈希表对哈希函数(hashCode)的质量非常敏感。至关重要的是,输入中的任何更改都必须影响哈希值的低位。(理想情况下,它应该以相同的可能性影响散列值的所有位。)因为我们不能保证这是真的,所以当我们切换到2的幂时,我们使用了一个次要(或“防御性”)散列函数。哈希表。在屏蔽低位之前,将此哈希函数应用于hashCode的结果。它的工作是将信息分散到所有位上,尤其是分散到低位位上。当然它必须
非常 运行 __速度很快,否则您将失去切换到2的幂的表格的好处。
1.4中原来的辅助哈希函数证明是不够的。我们知道这是理论上的可能性,但我们认为它不会影响任何实际数据集。我们错了。备用二级哈希函数(由我借助计算机开发)具有强大的统计特性,几乎可以保证良好的存储桶分配。

2020-12-03