我有一个数据集,其中包含一些酒店的名称和对每个酒店的评论,我想只对数据集中重复次数最多的10家酒店应用情感分析,因为数据集包含大约500家酒店那么,如何选择只针对前10名酒店的评论呢??我试着:
DF[DF['hotels']==DF['hotels'].value_counts()[:10]]['review']
但是它没有工作,它给了我一个错误:
只能比较相同标记的Series对象
线索吗? ?
在value_counts
输出的索引上使用isin
,并且使用loc
而不是链式切片,以便在以后使用该切片系列时避免SettingWithCopyWarning
。
out = DF.loc[DF['hotels'].isin(DF['hotels'].value_counts().index[:10]), 'review']