如何对字符串列表进行排序?

时间:2020-03-05 18:45:30  来源:igfitidea点击:

在Python中创建按字母顺序排序的列表的最佳方法是什么?

解决方案

回答

list.sort()

真的就是这么简单:)

回答

基本答案:

mylist = ["b", "C", "A"]
mylist.sort()

这会修改原始列表(即就地排序)。要获得列表的排序副本而不更改原始副本,请使用sorted()函数:

for x in sorted(mylist):
    print x

但是,上面的示例有些天真,因为它们没有考虑区域设置,而是执行区分大小写的排序。我们可以利用可选参数key来指定自定义排序顺序(使用cmp的替代方法是不建议使用的解决方案,因为必须多次评估key每个元素仅计算一次)。

因此,要根据当前语言环境进行排序,并考虑到特定于语言的规则(cmp_to_key是functools中的一个辅助函数):

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后,如果需要,可以指定一个自定义语言环境进行排序:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后要注意的是:我们将看到使用不区分大小写的排序示例,这些示例使用lower()方法是不正确的,因为它们仅适用于ASCII字符子集。对于任何非英语数据,这两个错误:

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)

回答

But how does this handle language specific sorting rules? Does it take locale into account?

不,list.sort()是一个通用的排序功能。如果要根据Unicode规则进行排序,则必须定义一个自定义的排序键函数。我们可以尝试使用pyuca模块,但我不知道它的完整性。

回答

值得注意的是sorted()函数:

for x in sorted(list):
    print x

这将返回列表的新的排序版本,而不更改原始列表。

回答

字符串排序的正确方法是:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

前面的mylist.sort(key = lambda x:x.lower())示例对于仅ASCII上下文适用。