找到psutil后,我做了一个简单的实验。有一个完全 IO 的基本函数,可以重复从文件中读取一些 numpy 数组(每个数组都有 763M 大小(。然后,在 100 秒后使用"cpu_times"测量函数的时间使用情况。我希望大部分时间都在iowait上经过,但结果如下:
pcputimes(user=22.92, system=77.1, children_user=0.0, children_system=0.0, iowait=0.0)
为什么 iowait 为零?为什么系统大部分时间都经过了?
代码如下:
def io_read_bound():
i=0
while True:
a = np.load("/tmp/a%d.npy"%i)
print(a.sum()) # for forcing use of data
i = (i+1)%10
p = multiprocessing.Process(target=io_read_bound)
p.start()
ps = psutil.Process(p.pid)
time.sleep(100)
print(ps.cpu_times())
这个编写 numpy 数组的实验结果是合理的,74% 的时间是针对 iowait。
psutil 作者在这里。可能文件已经在缓存中?您可以尝试使用 vmtouch cmdline 实用程序来逐出文件缓存。 如果您多次读取文件并在每次循环中逐出缓存,我很确定计数器会增加。前段时间我引入了iowait来尝试文件副本,这是我当时的经验。