按字符串顺序对非拉丁字符集进行排序



我使用以下代码表单排序:

letters = '세븐일레븐'
old = [('세븐', 8), ('븐', 2), ('일', 5), ('레', 4)]
new = sorted(old, key=lambda x: letters.index(x[0]))

对于非拉丁字符,输出与输入相同:

[('세븐', 8), ('븐', 2), ('일', 5), ('레', 4)]

我期待的是:

[('세븐', 8), ('일', 5), ('레', 4), ('븐', 2)]

排序没有问题。请注意,字母"븐"在字母字符串中出现了两次。由于 index 返回该字母的第一个索引,因此 letters.index('븐') 的计算结果为 1,这赋予了它很高的优先级。

为什么你希望'일''븐'之前排序? '븐'letters中的第二个字符; index将返回它找到的第一个实例。

如果目标是以不同的方式处理特定序列,则需要将letters定义为您关心的完整字符串的list,而不是单个平面str,例如:

letters = ['세븐', '일', '레', '븐']

然后index调用会将'세븐'视为与'븐'分开,并且您得到预期的输出排序。

相关内容

  • 没有找到相关文章