StackExchange.Redis 超时和"No connection is available to service this operation"



我在生产环境中遇到以下问题(Web-Farm - 4 个节点,在它负载均衡器之上):

1)Timeout performing HGET key, inst: 3, queue: 29, qu=0, qs=29, qc=0, wr=0/0 at StackExchange.Redis.ConnectionMultiplexer.ExecuteSyncImpl[T](Message message, ResultProcessor``1 processor, ServerEndPoint server) in ConnectionMultiplexer.cs:line 1699 这在一分钟内发生3-10次

2) No connection is available to service this operation: HGET key at StackExchange.Redis.ConnectionMultiplexer.ExecuteSyncImpl[T](Message message, ResultProcessor``1 processor, ServerEndPoint server) in ConnectionMultiplexer.cs:line 1666

试图按照 Marc 的建议实现(也许我解释错误了) - 与 Redis 的连接更少而不是多个连接。我进行了以下实现:

public class SeRedisConnection
{
    private static ConnectionMultiplexer _redis;
    private static readonly object SyncLock = new object();
    public static IDatabase GetDatabase()
    {
        if (_redis == null || !_redis.IsConnected || !_redis.GetDatabase().IsConnected(default(RedisKey)))
        {
            lock (SyncLock)
            {
                try
                {
                    var configurationOptions = new ConfigurationOptions
                    {
                        AbortOnConnectFail = false
                    };
                    configurationOptions.EndPoints.Add(new DnsEndPoint(ConfigurationHelper.CacheServerHost,
                        ConfigurationHelper.CacheServerHostPort));
                    _redis = ConnectionMultiplexer.Connect(configurationOptions);
                }
                catch (Exception ex)
                {
                   IoC.Container.Resolve<IErrorLog>().Error(ex);
                    return null;
                }
            }
        }
        return _redis.GetDatabase();
    }
    public static void Dispose()
    {
        _redis.Dispose();
    }
}

实际上,现在没有使用处置。此外,我还有一些可能导致这种行为的实现细节(我只使用哈希):1. 添加、删除哈希 - 异步2. 获取同步

有人可以帮助我如何避免这种行为吗?

提前非常感谢!

已解决 - 评估网络功能后增加客户端连接超时。

更新2:实际上它并没有解决问题。当缓存量开始增加时,例如从 2GB。然后我看到了相同的模式,实际上这些超时大约每 5 分钟发生一次。我们的网站每 5 分钟冻结一段时间,直到叉子操作完成。然后我发现有一个选项可以每 x 秒制作一个分叉(保存到磁盘):

save 900 1
save 300 10
save 60 10000

在我的情况下,它是"保存 300 10" - 如果至少发生 5 次更新,则每 10 分钟保存一次。我还发现"叉子"可能非常昂贵。注释的"保存"部分完全解决了问题。我们可以注释"保存"部分,因为我们仅使用 Redis 作为"内存中的缓存" - 我们不需要任何持久性。以下是我们的缓存服务器"Redis 2.4.6"窗口端口的配置:https://github.com/rgl/redis/downloads

也许在MSOpentech中最新版本的Redis Windows端口中已经解决了这个问题:http://msopentech.com/blog/2013/04/22/redis-on-windows-stable-and-reliable/但我还没有测试过。

无论如何,StackExchange.Redis与这个问题无关,它在我们的生产环境中运行非常稳定,这要归功于Marc Gravell。

最后更新:Redis 是单线程解决方案 - 它最终很快,但是当涉及到释放内存(删除过时或过期的项目)时,由于一个线程应该回收内存(这不是快速操作 - 无论使用什么算法)并且同一线程应该处理 GET、SET 操作。当然,当我们谈论中等负载的生产环境时,就会发生这种情况。即使您在达到内存屏障时使用带有从属服务器的集群,它也将具有相同的行为。

看起来在大多数情况下,此异常是客户端问题。以前版本的 StackExchange.Redis 直接使用 Win32 套接字,这有时会产生负面影响。可能 Asp.net 内部路由以某种方式与之相关。
好消息是,StackExchange.Redis 的网络基础设施最近被完全重写了。最新版本是 2.0.513。尝试一下,您的问题很有可能会消失。

相关内容

最新更新