如果存在连续索引,则合并行



我试图将列text_info中的字符串仅在索引连续的情况下组合在一行中。我得到的数据与下表非常相似:

<表类> 指数 text_info tbody><<tr>0.0词1南南3.0word20.0word31.0word42.0经常4.0word6

试试这个。如果您的NAN值是字符串而不是np.NaN值,则使用pd.to_numeric()

(df.astype(str)
.groupby(pd.to_numeric(df['index'],errors='coerce').diff().ne(1).cumsum(),as_index=False)
.agg({'index':'first','text_info':', '.join}))

输出:

index            text_info
0   0.0               word 1
1   nan                  nan
2   3.0                word2
3   0.0  word3, word4, word5
4   4.0                word6

相关内容

  • 没有找到相关文章

最新更新