我们的Graphite服务器正面临CPU和磁盘瓶颈。主要问题是 %IO 等待时间始终在 40% 的范围内。我们在具有 7.5 GiB RAM 的 RHEL 服务器上的 2 核 CPU 上运行它。(同意,我们的 CPU 配置是原始的,但我们想在升级之前了解为什么会发生以下情况。
我们的 Graphite 服务器每分钟处理超过 160,000 个数据点。但磁盘 IO 统计信息显示,40% 的时间花费在 IO 等待上。我们的磁盘CISS每秒可以写入160 MiB,但Graphite每秒只能使用2MiB。
有没有人遇到过这个问题?您的发现是什么?您对上述问题有什么建议吗?
谢谢!
我参加聚会可能有点晚了。我读到一个旋转磁盘每秒可以执行大约 75-100 个 io 操作(有道理:7200rpm = 每秒 120 转,典型的 9ms 延迟......因此,如果是这种情况,MAX_UPDATES_PER_SECOND的默认值 500 对我来说没有意义。
我尝试运行 bonnie++ 来测试我的磁盘性能,它每秒高达 50 次随机查找(不是在单用户模式下)。
我正在研究类似的性能问题,并将MAX_UPDATES_PER_SECOND值调低到 10。在我们的例子中,大约有 2000 个指标,这意味着每 200 个指标都会写入磁盘,这对我们有用。