重构数据框架



目前我正在处理从模拟器获得的数据。它被放入来自Pandas的DataFrame中。这里的输出是:

1. DateTime, Sensor, Value
2. 1/13/2021 12:56:10, XTDSX5, 16.55
3. 1/13/2021 12:56:10, XTDSX6, 55.55
4. 1/13/2021 12:56:10, XTDSX9p, -15.16
5. 1/13/2021 12:56:20 PM, XTDSX5, 15.20
6. 1/13/2021 12:56:20 PM, XTDSX9p, -15.66
7. 1/13/2021 12:56:30 PM, XTDSX6, 55.56
etc.

现在我想把这个数据转换成:

1. DateTime XTDSX5, XTDSX6, XTDSX9p
2. 1/13/2021 12:56:10, 16.55, 55.55,-15.16
3. 1/13/2021 12:56:20, 15.20, NaN, -15.66
4. 1/13/2021 12:56:30, NaN, 55.56, NaN

这使得它适合人工智能分类。有人知道我怎么做最好吗?

pivoted_df = pd.pivot_table(data=df,
index="DateTime",
columns="Sensor",
)
pivoted_df.reset_index(inplace=True)

基本上,pd.pivot_table将创建一个新的DataFrame,其索引将是原DataFramedfDateTime列的唯一元素,其列将是原dfSensor列的唯一元素。不需要指定pd.pivot_tablevalue参数,因为df中只有另一列。由于答案需要一个简单的索引,因此我使用reset_index,它保留pivoted_dfDateTime索引作为列。

最新更新