nchar("u058f")
[1] 1
给我一个惊喜(我本以为是6或4(。
问题
我们如何测量包含形式为uxxxx
的unicode表示的字符串中的文字字符数?
到目前为止我尝试了什么
我试着修改不同的types
,但
> nchar("u058f", type = "bytes")
[1] 2
> nchar("u058f", type = "chars")
[1] 1
> nchar("u058f", type = "width")
[1] 1
您需要转义Unicode字符,这可以通过例如字符串函数stri_escape_unicode
:来完成
nchar(stringi::stri_escape_unicode("u058f"))
# [1] 6