我正在处理纽约MVA数据。该数据集包含约170万条纽约市周围的车祸数据记录。我创建了一个名为TOTAL PEDESTRIAN CASUALTIES
的新变量,并试图将其与一天中的几个小时进行比较:
plt.plot(df['TOTAL PEDESTRIAN CASUALTIES'], df['CRASH TIME'].dt.hour)
当我这样做时,我会得到以下错误:
OverflowError: Exceeded cell block limit (set 'agg.path.chunksize' rcparam)
根据Serenity的回答,我已经尝试设置rcParams
:
import matplotlib as mpl
mpl.rcParams['agg.path.chunksize'] = 2_000_000
然而,即使有200万块,它仍然太小了。我做得更大了,没有任何效果。显然,我应该能够用更少的钱做更多的事情。
如何更正此问题以创建此情节?
我刚刚在plt.plot()
之前用设置mpl.rcParams['agg.path.chunksize'] = 10000
重新启动了IDE,它似乎可以工作。