我有两个代码,下面将详细解释。
代码 1:读取一个.csv文件,其中包含时间戳作为一列,每个时间戳的相应值作为另一列。
代码 2:读取数据库并从具有两列的数据库中获取数据 - 时间戳作为一列,每个时间戳的相应值作为另一列。
对于代码 1,当我尝试访问/打印与时间戳对应的值时,它会打印单个 numpy.float64 值。这就是我希望我的输出方式。
但是,对于代码 2,当我尝试打印与时间戳对应的值时,它会打印一个具有一个对象类型值的系列。
为什么存在差异,即使从技术上讲两者都是数据帧,也可能导致输出差异的原因?如何更正此问题?
已尝试以下操作:
- 将对象类型转换为 numpy.float64。仍然返回一个系列。
-
读取数据库,将其转换为.csv格式,再次读取.csv文件并尝试访问。仍然返回一个系列。
from_db = MySQLdb.connect("xx.xx.xx.xx", "abcde", "12345", "TABLE_DB") sql = "SELECT * FROM `SOME_TABLE` WHERE `THIS IS` = '123456'" dmd_data = pd.read_sql(sql, con=from_db) dmd_data = dmd_data.NAME start_tstamp = '2016-10-08 00:00:00' start = datetime.datetime.strptime(start_tstamp,f) fact1 = (start-datetime.timedelta(days=1)).strftime(f)
预期输出为:
In [53]: dmd_data[fact1]
Out[53]: 4454.82406196
In [67]: type(dmd_data[fact1])
Out[67]: numpy.float64
我得到的输出是:
In [53]: dmd_data[fact1]
Out[53]:
TIMESTAMP
2016-10-07 4454.82406196
Name: DEMAND, dtype: object
In [60]: type(data[fact1])
Out[60]: pandas.core.series.Series
首先将其转换为数据帧:
df = series_data.to_frame()
// series_data is your data existing in 'pandas.core.series.Series' object form
现在转置结果
df = df.T
现在访问相应键的值。 如果问题仍然存在,请检查读取数据的数据类型和密钥以及您提供的数据类型和密钥!