我在生产环境中遇到以下问题(Web-Farm - 4 个节点,在它负载均衡器之上):
1)Timeout performing HGET key, inst: 3, queue: 29, qu=0, qs=29, qc=0, wr=0/0
at StackExchange.Redis.ConnectionMultiplexer.ExecuteSyncImpl[T](Message message, ResultProcessor``1 processor, ServerEndPoint server) in ConnectionMultiplexer.cs:line 1699
这在一分钟内发生3-10次
2) No connection is available to service this operation: HGET key at StackExchange.Redis.ConnectionMultiplexer.ExecuteSyncImpl[T](Message message, ResultProcessor``1 processor, ServerEndPoint server) in ConnectionMultiplexer.cs:line 1666
试图按照 Marc 的建议实现(也许我解释错误了) - 与 Redis 的连接更少而不是多个连接。我进行了以下实现:
public class SeRedisConnection
{
private static ConnectionMultiplexer _redis;
private static readonly object SyncLock = new object();
public static IDatabase GetDatabase()
{
if (_redis == null || !_redis.IsConnected || !_redis.GetDatabase().IsConnected(default(RedisKey)))
{
lock (SyncLock)
{
try
{
var configurationOptions = new ConfigurationOptions
{
AbortOnConnectFail = false
};
configurationOptions.EndPoints.Add(new DnsEndPoint(ConfigurationHelper.CacheServerHost,
ConfigurationHelper.CacheServerHostPort));
_redis = ConnectionMultiplexer.Connect(configurationOptions);
}
catch (Exception ex)
{
IoC.Container.Resolve<IErrorLog>().Error(ex);
return null;
}
}
}
return _redis.GetDatabase();
}
public static void Dispose()
{
_redis.Dispose();
}
}
实际上,现在没有使用处置。此外,我还有一些可能导致这种行为的实现细节(我只使用哈希):1. 添加、删除哈希 - 异步2. 获取同步
有人可以帮助我如何避免这种行为吗?
提前非常感谢!
已解决 - 评估网络功能后增加客户端连接超时。
更新2:实际上它并没有解决问题。当缓存量开始增加时,例如从 2GB。然后我看到了相同的模式,实际上这些超时大约每 5 分钟发生一次。我们的网站每 5 分钟冻结一段时间,直到叉子操作完成。然后我发现有一个选项可以每 x 秒制作一个分叉(保存到磁盘):
save 900 1
save 300 10
save 60 10000
在我的情况下,它是"保存 300 10" - 如果至少发生 5 次更新,则每 10 分钟保存一次。我还发现"叉子"可能非常昂贵。注释的"保存"部分完全解决了问题。我们可以注释"保存"部分,因为我们仅使用 Redis 作为"内存中的缓存" - 我们不需要任何持久性。以下是我们的缓存服务器"Redis 2.4.6"窗口端口的配置:https://github.com/rgl/redis/downloads
也许在MSOpentech中最新版本的Redis Windows端口中已经解决了这个问题:http://msopentech.com/blog/2013/04/22/redis-on-windows-stable-and-reliable/但我还没有测试过。
无论如何,StackExchange.Redis与这个问题无关,它在我们的生产环境中运行非常稳定,这要归功于Marc Gravell。
最后更新:Redis 是单线程解决方案 - 它最终很快,但是当涉及到释放内存(删除过时或过期的项目)时,由于一个线程应该回收内存(这不是快速操作 - 无论使用什么算法)并且同一线程应该处理 GET、SET 操作。当然,当我们谈论中等负载的生产环境时,就会发生这种情况。即使您在达到内存屏障时使用带有从属服务器的集群,它也将具有相同的行为。
看起来在大多数情况下,此异常是客户端问题。以前版本的 StackExchange.Redis 直接使用 Win32 套接字,这有时会产生负面影响。可能 Asp.net 内部路由以某种方式与之相关。
好消息是,StackExchange.Redis 的网络基础设施最近被完全重写了。最新版本是 2.0.513。尝试一下,您的问题很有可能会消失。