在透视调查数据表时遇到问题



我使用的是Kaggle(Link(的"LGBT_Survey_DailyLife.csv"数据集,没有question_code和注释列。

我希望每个问题 (question_label( 和国家(国家/地区代码(组合都在自己的行上,并使每列都是组(子集(和响应(答案(的组合,值是百分比列中给出的值。

这似乎应该非常简单,但是当我运行以下内容时:

daily_life.pivot(index = ['CountryCode', 'question_label'], columns = ['subset', 'answer'], values = 'percentage')*

我收到此错误:

错误:传递值的长度为 34020,索引意味着 2*

您必须首先清理percentage列,因为它包含非整数值 然后使用pivot_table


df.percentage = df.percentage.replace(':', 0).astype('float')
df1 = df.pivot_table(values="percentage", index=["CountryCode", "question_label"], columns=["subset", "answer"])

最新更新