我尝试在我的数据框架中计算每个表情符号(在表情符号库中)的出现次数。我的方法:
emoji_cnt = [[] for i in range(len(list(emoji.UNICODE_EMOJI.keys())))]
j = 0
for key, value in emoji.UNICODE_EMOJI.items():
emoji_cnt[j].append(key)
j = j+1
for k in emoji_cnt:
s = df["Message"].str.count(k[0]).sum()
k.append(s)
实际工作。我试着把数字打印出来(在循环中),它工作了。但是程序停止了,我得到以下错误:
File "C:UsersUSERanaconda3libsre_parse.py", line 668, in _parse
raise source.error("nothing to repeat",
error: nothing to repeat
我在Anaconda和Python 3.8上使用Spyder。
非常感谢大家:)
维也纳的问候!
于是找到了办法。我必须为正则表达式使用这个模块。所以:
import re
.
.
.
emoji_cnt = [[] for i in range(len(list(emoji.UNICODE_EMOJI.keys())))]
j = 0
for key, value in emoji.UNICODE_EMOJI.items():
emoji_cnt[j].append(key)
j = j+1
for k in emoji_cnt:
s = df["Message"].str.count(re.escape(k[0])).sum()
k.append(s)
re.escape (k [0])将k[0]中的表情符号改为正则表达式。
:)