我正试图从下面的数据帧中创建一个单词云
Borough Minor Text 2019
Bexley Arson 4
Bexley Burglary - Business 11
Bexley Burglary - Residential 130
Bexley Drug Trafficking 5
我想在wordcloud中可视化次要文本列中最频繁的项目,但问题是,频率在"2019"列中是一个整数。实际的数据帧相当大,但遵循与上面相同的格式。有人能建议我如何转换"次要文本"列,以便准确创建单词云吗?
感谢
我不知道可视化标准。例如,PowerBI的wordcloud不接受整数值来控制单词的大小,但它基于重复的项目数。因此,我处理它的方法是将文本转换为列表,然后将其乘以整数(因此,按照整数所说的次数重复文本(,然后PowerBI看到第3行被重复了130次,而第4行只有5次,使第3行的文本比第4行的文本大26倍。
在解释了这一点之后,这是我使用的代码行:
df['Visual text'] = df['Minor Text'].map(lambda x: [x]) * df['2019']