按字符串顺序对非拉丁字符集进行排序

我使用以下代码表单排序：

letters = '세븐일레븐'
old = [('세븐', 8), ('븐', 2), ('일', 5), ('레', 4)]
new = sorted(old, key=lambda x: letters.index(x[0]))

对于非拉丁字符，输出与输入相同：

[('세븐', 8), ('븐', 2), ('일', 5), ('레', 4)]

我期待的是：

[('세븐', 8), ('일', 5), ('레', 4), ('븐', 2)]

排序没有问题。请注意，字母"븐"在字母字符串中出现了两次。由于 index 返回该字母的第一个索引，因此 letters.index（'븐'）的计算结果为 1，这赋予了它很高的优先级。

为什么你希望'일'在'븐'之前排序？ '븐'是letters中的第二个字符; index将返回它找到的第一个实例。

如果目标是以不同的方式处理特定序列，则需要将letters定义为您关心的完整字符串的list，而不是单个平面str，例如：

letters = ['세븐', '일', '레', '븐']

然后index调用会将'세븐'视为与'븐'分开，并且您得到预期的输出排序。

相关内容