使用matplotlib创建散点图会给我一个空的或正确的图,这取决于我是从带有from_dict
的字典还是从只带有pandas.DataFrame
的列表中构建panda数据帧。
import pandas as pd
import matplotlib.pyplot as plt
list_data = ['2016-10-06', '2016-09-24', 55, 'dummy', 0.510823, 0.29431]
columns = ['master', 'slave', 'baseline', 'coh', 'coh_mean', 'coh_std']
dict_data = dict(zip(columns, list_data))
data = pd.DataFrame.from_dict(dict_data, orient='index').T
data.slave = pd.to_datetime(data.slave)
fig, axes = plt.subplots()
axes.scatter(data.slave.values, data.baseline.values)
plt.show()
结果在:
空图
而:
list_data = ['2016-10-06', '2016-09-24', 55, 'dummy', 0.510823, 0.29431]
columns = ['master', 'slave', 'baseline', 'coh', 'coh_mean', 'coh_std']
data = pd.DataFrame([list_data], columns=columns)
data.slave = pd.to_datetime(data.slave)
fig, axes = plt.subplots()
axes.scatter(data.slave.values, data.baseline.values)
plt.show()
结果在:
正确的绘图
MacOS Sierra 10.12.6 ||python:v3.6.2||matplotlib:v2.0.2 ||pandas v0.20.3
我尝试过各种后端以及python:v2.7,但都没有成功。有人能解释为什么会发生(甚至重现):Matplotlib和datetime的OverflowError吗?
之所以会发生这种情况,是因为从字典创建数据帧(使用上述方法)并不是在推断数据类型。它可能在更高版本中,但我正在运行0.20.1
。出于演示目的,我将您的dfs:重命名为
df_fromdict = pd.DataFrame.from_dict(dict_data, orient='index').T
df_fromdict.slave = pd.to_datetime(df_fromdict.slave)
df_fromdict.dtypes
master object
slave datetime64[ns]
baseline object # notice here your baseline column is not recognized as int
coh object
coh_mean object
coh_std object
dtype: object
df_fromlist = pd.DataFrame([list_data], columns=columns)
df_fromlist.slave = pd.to_datetime(df_fromlist.slave)
df_fromlist.dtypes
master object
slave datetime64[ns]
baseline int64 # recognized as int by default
coh object
coh_mean float64
coh_std float64
dtype: object
尝试以下测试,您的第一个散点图应该如预期那样出现:
fig, axes = plt.subplots()
axes.scatter(df_fromdict.slave.values, df_fromdict.baseline.astype(int).values)
plt.show()