计数IOrderedEnumerable而不消耗它



我想做什么,短版本:

var source = new[]{2,4,6,1,9}.OrderBy(x=>x);
int count = source.Count; // <-- get the number of elements without performing the sort

长版本:

要确定IEnumerable中的元素数量,必须对所有元素进行迭代。这可能是一项非常昂贵的操作。

如果IEnumerable可以强制转换为ICollection,则可以在不迭代的情况下快速确定计数。LINQ Count()方法会自动执行此操作。

函数myEnumerable.OrderBy()返回一个IOrderedEnumerableIOrderedEnumerable显然不能强制转换为ICollection,因此调用Count()将消耗整个过程。

但是排序不会改变元素的数量,IOrderedEnumerable必须保留对其源的引用。因此,如果该源是ICollection,则应该可以在不消耗IOrderedEnumerable的情况下确定计数。

我的目标是有一个库方法,它采用一个带有n个元素的IEnumerable,然后例如检索位于n/2位置的元素;

我想避免为了获得计数而在IEnumerable上迭代两次,但如果可能的话,我也希望避免创建不必要的副本。


以下是我想要创建的函数的骨架

public void DoSomething(IEnumerable<T> source)
{
    int count; // What we do with the source depends on its length
    if (source is ICollection)
    {
        count = source.Count(); // Great, we can use ICollection.Count
    }
    else if (source is IOrderedEnumerable)
    {
        // TODO: Find out whether this is based on an ICollection, 
        // TODO: then determine the count of that ICollection
    }
    else
    {
        // Iterating over the source may be expensive, 
        // to avoid iterating twice, make a copy of the source
        source = source.ToList();
        count = source.Count();
    }
    // do some stuff
}

让我们想想这个代码实际上是什么样子的:

var source = new[]{ 2, 4, 6, 1, 9 }.OrderBy(x => x);
int count = source.Count();

与相同

int count = Enumerable.Count(Enumerable.OrderBy(new[]{ 2, 4, 6, 1, 9 }, x => x));

Enumerable.OrderBy(new[]{ 2, 4, 6, 1, 9 }, x => x)的结果被传递到Count扩展中。无法避免执行OrderBy。因此,它是非流式运营商,它在返回一些东西之前消耗了所有的源,这些东西将传递给Count

因此,避免对所有集合进行迭代的唯一方法是在排序之前避免OrderBy计数项。


UPDATE:您可以在任何OrderedEnumerable上调用此扩展方法,它将使用反射来获取OrderedEnumerable<T>source字段,该字段包含源序列。然后检查此序列是否为集合,并在不执行排序的情况下使用Count

public static class Extensions
{
    public static int Count<T>(this IOrderedEnumerable<T> ordered)
    {
        // you can check if ordered is of type OrderedEnumerable<T>
        Type type = ordered.GetType();
        var flags = BindingFlags.NonPublic | BindingFlags.Instance;
        var field = type.GetField("source", flags);
        var source = field.GetValue(ordered);
        if (source is ICollection<T>)
            return ((ICollection<T>)source).Count;
        return ordered.Count();
    }
}

用法:

var source = new[]{ 2, 4, 6, 1, 9 }.OrderBy(x => x);
int count = source.Count();

如果你想创建一个高性能的解决方案,我会考虑创建重载,它采用集合或IOrderedEnumerable等。所有的"is"one_answers"as"类型检查和强制转换都不适合你正在创建的东西。

你正在重新发明轮子。linq的"Count()"函数可以随心所欲地执行操作。

此外,添加this关键字并将其作为一个漂亮的扩展方法,以取悦您自己和其他使用代码的人。

DoSomething(this Collection source);
DoSomething<T>(this List<T> source);
DoSomething<T>(this IOrderedEnumerable<T> source);

等等。。。

另一种方法是实现一个实现IOrderedEnumerable<T>的类。然后,您可以实现类成员,这些类成员将缩短通常的Linq扩展方法,并提供一个查看原始枚举的count方法。

public class MyOrderedEnumerable<T> : IOrderedEnumerable<T>
{
    private IEnumerable<T> Original;
    private IOrderedEnumerable<T> Sorted;
    public MyOrderedEnumerable(IEnumerable<T> orig)
    {
            Original = orig;
            Sorted = null;
    }
    private void ApplyOrder<TKey>(Func<T, TKey> keySelector, IComparer<TKey> comparer, bool descending)
    {
            var before = Sorted != null ? Sorted : Original;
            if (descending)
                    Sorted = before.OrderByDescending(keySelector, comparer);
            else
                    Sorted = before.OrderBy(keySelector, comparer);
    }
    #region Interface Implementations
    public IEnumerator<T> GetEnumerator()
    {
            return Sorted != null ? Sorted.GetEnumerator() : Original.GetEnumerator();
    }
    IEnumerator IEnumerable.GetEnumerator()
    {
            return GetEnumerator();
    }
    public IOrderedEnumerable<T> CreateOrderedEnumerable<TKey>(
            Func<T, TKey> keySelector,
            IComparer<TKey> comparer,
            bool descending)
    {
            var newSorted = new MyOrderedEnumerable<T>(Original);
            newSorted.ApplyOrder(keySelector, comparer, descending);
            return newSorted;
    }
    #endregion Interface Implementations

    //Ensure that OrderBy returns the right type. 
    //There are other variants of OrderBy extension methods you'll have to short-circuit
    public MyOrderedEnumerable<T> OrderBy<TKey>(Func<T, TKey> keySelector)
    {   
            Console.WriteLine("Ordering");
            var newSorted = new MyOrderedEnumerable<T>(Original);
            newSorted.Sorted = (Sorted != null ? Sorted : Original).OrderBy(keySelector);
            return newSorted;
    }
    public int Count()
    {
            Console.WriteLine("Fast counting..");
            var collection = Original as ICollection;
            return collection == null ? Original.Count() : collection.Count;
    }
    public static void Test()
    {
            var nums = new MyOrderedEnumerable<int>(Enumerable.Range(0,10).ToList());
            var nums2 = nums.OrderBy(x => -x);
            var z = nums.Count() + nums2.Count();
    }
}

相关内容

  • 没有找到相关文章

最新更新