r语言 - 如何在Mac上编辑MeCab字典?



如何在Mac上更改单词的定义?MeCab吗?我正在分析R上的文本数据,但有些字母(如,",()等)不被定义为符号,而是作为名词。所以我不能排除这些字母,因为有些字母不被视为字符。例如,我想执行如下代码

df <- df %>%
dplyr::filter(! TERM %in% c("", """)) # TERM is the variable name.

但是这不起作用,因为我不能对这些字母应用""

所以我需要改变MeCab字典中这些符号字母的定义。但我不知道该怎么做。这个问题一定很基本,但是我恐怕不明白如何在Mac终端上打开和编辑文件。

注:

复制数据
# code
dput(pilot_data[1:10, "IMAGE_total"])
# output
structure(list(IMAGE_total = c("遠い 難しい 不安", 
"国民を動かす討論 世の中を平和に維持する大切なもの 選挙するもの", 
"苛立ちの対象だ。 不快なものだ。 悲しいものだ。", 
"身近ではない 必要ない 茶番劇である", "難しい物 遠い存在 高みの見物的な物", 
"汚いもの 興味深いもの 信用できないもの", 
"ダーティーな行為だ うさんくさい世界だ できればかかわりたくないことだ", 
"意味がない 敵である 興味がないもの", 
"生活に影響してくるもの。 きまりごとをつくるところ 縁のない世界", 
"国会議員のもの。 くだらない世界。 金にまみれた世界。"
)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
))

pilot_data为数据框,IMAGE_total为开放式调查问题的答案。这些日本字可能很难对待,我道歉。

使用下面的代码,我可以运行分析。

df <- df %>%
dplyr::filter(!str_detect(TERM, '[\\"()]')) 

谢谢你的帮助。

最新更新