选择特定评论应用情绪分析



我有一个数据集,其中包含一些酒店的名称和对每个酒店的评论,我想只对数据集中重复次数最多的10家酒店应用情感分析,因为数据集包含大约500家酒店那么,如何选择只针对前10名酒店的评论呢??我试着:

DF[DF['hotels']==DF['hotels'].value_counts()[:10]]['review']

但是它没有工作,它给了我一个错误:

只能比较相同标记的Series对象

线索吗? ?

value_counts输出的索引上使用isin,并且使用loc而不是链式切片,以便在以后使用该切片系列时避免SettingWithCopyWarning

out = DF.loc[DF['hotels'].isin(DF['hotels'].value_counts().index[:10]), 'review']

相关内容

最新更新