如何选择python pandas排列列与行



我对pandas很陌生(几个月(,我正在开始构建一个基于pandas数据阵列的项目。

这样的panda数据阵列将由一个表组成,该表包括文本集合中存在的不同类型的单词(约10万个文档和约200个关键词(。

例如,想象单词"汽车"和单词"摩托车"以及编号为doc1、doc2等的文件。

我该如何安排?a( 每一列的名称都是文件编号和索引——单词"汽车"one_answers"摩托车"或b( 反之亦然;索引是文档编号,列标题是单词?

我对熊猫没有足够的了解,无法预见这种选择会带来什么后果。所有的代码都将基于这个决定。

需要注意的是,数组不是静态的,时不时会有更多的文档和单词添加到数组中。

你推荐什么?a还是b?为什么?

谢谢。

通常在panda中,我们遵循的做法是实例是列(此处为文档编号(,特性是列(这里为单词(。因此,更喜欢使用方法"b"。

最新更新