是否有大型字典的 IDictionary 实现,使其不会在大型对象堆上结束



这与.NET Collection和大型对象堆(LOH)密切相关。简而言之,如果存储桶超过 85K,它会自动在 LOH 上,何时发布是未知的。有没有人知道基于数组列表或类似的东西的 IDictionary 的良好实现阻止它进入 LOH?

您可以使用 SortedDictionary ,这是一个二叉树。

如果您需要字典的 O(1) 性能,或者更接近的性能,您可以使用不同的哈希表实现,将数据存储在足够小的块中,以便不继续使用 LOH。 我不知道任何公开可用的东西;我过去使用过SortedDictionary,发现性能下降很小,所以我没有再看了。

这是一个选项的开始。 我假设您可以按照给定的模式来实现其他方法。

只需更改numDictionaries即可确定它的分解方式。

如果你真的需要,你可以使词典的数量动态化,并在现有词典变得足够大时添加更多词典。

public class NonContigousDictionary<TKey, TValue>
//TODO make this implement IEnumerable, IDictionary, 
//and any other relevant interfaces.
{
    public Dictionary<TKey, TValue>[] dictionaries;
    private readonly int numDictionaries = 5;
    public NonContigousDictionary()
    {
        dictionaries = Enumerable.Range(0, numDictionaries)
            .Select(_ => new Dictionary<TKey, TValue>())
            .ToArray();
    }
    public TValue this[TKey key]
    {
        get
        {
            int hash = key.GetHashCode();
            return dictionaries[GetBucket(hash)][key];
        }
        set
        {
            int hash = key.GetHashCode();
            dictionaries[GetBucket(hash][key] = value;
        }
    }
    public bool Remove(TKey key)
    {
        int hash = key.GetHashCode();
        return dictionaries[GetBucket(hash].Remove(key);
    }
    public void Clear()
    {
        foreach (var dic in dictionaries)
        {
            dic.Clear();
        }
    }
    private int GetBucket(int hash)
    {
        return (hash % numDictionaries + numDictionaries) % numDictionaries;
    }
}

最新更新