测量包含unicode字符表示的字符串文字的长度


nchar("u058f")
[1] 1

给我一个惊喜(我本以为是6或4(。

问题

我们如何测量包含形式为uxxxx的unicode表示的字符串中的文字字符数?

到目前为止我尝试了什么

我试着修改不同的types,但

> nchar("u058f", type = "bytes")
[1] 2
> nchar("u058f", type = "chars")
[1] 1
> nchar("u058f", type = "width")
[1] 1

您需要转义Unicode字符,这可以通过例如字符串函数stri_escape_unicode:来完成

nchar(stringi::stri_escape_unicode("u058f"))
# [1] 6

相关内容

  • 没有找到相关文章

最新更新