在插入和搜索正常路径的尝试中,ascii 1-31 是否值得考虑



我正在研究一种插入和搜索正常路径的trie数据结构。

路径可以包含 unicode 中的任何字符,因此为了完全用 utf-8 表示它,trie 中的数组需要包含所有 256 个 ascii 的下一个节点。

但我也担心trie所占用的空间和插入时间。我的 trie 设置条件很少会插入 unicode 字符(我的意思是 128-255 ascii(。所以我只是放了一个 if 条件来拒绝包含 ascii 127 以上路径的路径。我认为 ascii 1-31 也不相关,尽管我不确定这一点。由于 1-31 个字符就像回车、esc 等,我可以简单地继续循环而不插入它们吗?比如在真实场景中是否有可能遇到由于 ascii 1-31 而实际上可微分的路径?

回答这个老问题,在macOS ascii 13 用于表示可能出现在许多路径中的自定义图标。感谢@EricPostpischil在评论中告诉了这一点。

所有其他介于1-31之间的字符在路径中出现的次数都很少。

此外,macOS用户大多具有不区分大小写的路径,因此通常同时考虑小写和大写也是无用的。

附注:

虽然这个问题看似基于意见,但实际上并不是因为它可以相当简洁地回答。它尝试询问字符在 macOS 上的路径中出现的频率。(对不起,标题混乱,那次我是个菜鸟,现在改了会让所有评论都荒唐(

相关内容

  • 没有找到相关文章

最新更新