错误:计数数据框中的出现次数时不需要重复

我尝试在我的数据框架中计算每个表情符号(在表情符号库中)的出现次数。我的方法:

emoji_cnt = [[] for i in range(len(list(emoji.UNICODE_EMOJI.keys())))]
j = 0
for key, value in emoji.UNICODE_EMOJI.items():
emoji_cnt[j].append(key)
j = j+1
for k in emoji_cnt: 
s = df["Message"].str.count(k[0]).sum()
k.append(s)

实际工作。我试着把数字打印出来(在循环中)，它工作了。但是程序停止了，我得到以下错误:

File "C:UsersUSERanaconda3libsre_parse.py", line 668, in _parse
raise source.error("nothing to repeat",
error: nothing to repeat

我在Anaconda和Python 3.8上使用Spyder。

非常感谢大家:)

维也纳的问候!

于是找到了办法。我必须为正则表达式使用这个模块。所以:

import re
.
.
.
emoji_cnt = [[] for i in range(len(list(emoji.UNICODE_EMOJI.keys())))]
j = 0
for key, value in emoji.UNICODE_EMOJI.items():
emoji_cnt[j].append(key)
j = j+1
for k in emoji_cnt: 
s = df["Message"].str.count(re.escape(k[0])).sum()
k.append(s)

re.escape (k [0])将k[0]中的表情符号改为正则表达式。

相关内容

最新更新

热门标签：