Linux sort命令

时间:2020-03-05 15:29:42  来源:igfitidea点击:

SORT命令用于Linux和UNIX系统中以特定顺序排列文件的内容。
使用排序命令我们在文件中订购行,字母表和数字。

SORT命令有许多有用的选项来相反顺序,在数字上排序文件,按列号对表进行排序,检查文件是否已排序并删除重复项。

在本教程中,我们在Linux中了解了某些实际示例中的排序命令。

排序命令及其语法

以下行显示Sort命令语法:

sort [options] [files]

默认情况下,它从STDIN取消输入,但可以在将文件名作为参数提供文件时对文件进行排序,并且它也可以数值排序。

可以通过键入终端中的"排序"来调用排序命令。
然后它将提示从Stdin的输入。
进入STDIN后,输入"CTRL + D"以用于标记输入结束。

以下输出显示STDIN的输入数据按字母顺序重新排列。

$sort
cappa
beta
delta
theta
alpha
alpha
beta
cappa
delta
theta

排序文件

默认情况下,排序将所有字符排序为字符串字符。
数字字符也被视为字符。

首先,我们创建一个包含要对数字数据进行排序的文件。

以下命令用数字数据创建文件'numeric.txt':

$cat > numeric.txt
01
10
25
83
502
111

现在,让我们排序文件'numeric.txt',如下所示:

$sort numeric.txt
01
10
111
25
502
83

上面显示的输出不是我们通常期望的。
当然,111大于25,502大于83.
但如果我们认为,数字在字典顺序中排序。

例如,对于111和25,比较第一字符,1前面2.因此111之前放置在25之前。

现在让我们检查内容是字母表或者单词时如何排序。
以下文件'WordList.txt'包含以大写案例和小写字母和显示排序列表开始的单词:

$sort wordlist.txt
Aeroplane
ant
apple
bark
born
Box
Cat
tom
welcome

排序选项

排序命令附带非常好的选择文件内容。
让我们讨论其中一些:

排序-n:以数字方式对文件进行排序。
排序u:抑制重复前面键的行。
排序-k:按列号排序表。
排序-tsep:使用提供的分隔符识别字段。
根据指定的日历月份对-m进行排序。
排序-b:在行开始时忽略空白。
排序--r:以相反的顺序排序。
排序-o:输出到一个新文件。

按数字排序文件(-n选项)

如果我们想在数字上对文件中的内容进行排序,我们使用-n选项。

在以下示例中,文件'numeric.txt'包含数字和数据以数字顺序排序:

$sort -n numeric.txt
01
10
25
83
111
502

要反转文件中的数字,请使用"-nr""选项的组合。

例如:

$sort -nr numeric.txt
502
111
83
25
10
01

排序和删除重复行(-u选项)

从文件中排序和删除重复行使用-u选项。
第一个命令将列出使用CAT命令的文件复制文件的内容,然后使用"-u""选项删除重复行。

例子:

$cat duplicate.txt
hello
linux
lInux
Linux
igi
world
zzz
zzz

示例输出,我们可以看到重复行的"duplicate.txt"文件:

$sort -u duplicate.txt
hello
linux
lInux
Linux
igi
world
zzz

排序和忽略案例(-f选项)

与许多其他Linux和UNIX工具一样,默认情况下,Sort命令区分大小写。
但如果我们需要忽略这种情况,我们可以使用-f或者--ignore-case选项。

例如,在"duplicate.txt"中,在不同情况下,有三个"Linux"这个词的实例。
默认情况下,它们都打印出"-u""选项。
这意味着它们不是sort命令的唯一。

但是,如果我们使用-f选项,它将被忽略如下所示:

$sort -f -u duplicate.txt
hello
linux
igi
world
zzz

按列排序(-k选项)

sort命令可以使用使用-k选项使用列号对任何表进行排序。
例如,使用'-k3'对表中的第三列进行排序。

允许我们考虑在"panders.txt"文件中有一个内容表,如下所示:

$cat population.txt
Kids 500 Netherlands
Youth 400 England
Senior 600 USA
Junior 9000 Australia
Pensioners 650 China

在以下内容中,我们将使用Plation.txt文件中的第2列对表进行排序:

$sort -k2 population.txt
Youth 400 England
Kids 500 Netherlands
Senior 600 USA
Pensioners 650 China
Junior 9000 Australia

排序多个列

在某些情况下,我们可能需要使用多列对表进行排序。
让我们拍摄包含多列数据列的文件的示例。

按照列出的文件'Columns.txt'contain多列:

cat columns.txt
version1.2    10  25
version1.2    30  50
version1.1    10  30
version1.1    40  50
version1.2    40  50
version1.1    10  20
version1.1    5   8

现在检查命令以数字顺序排序列1,2和3.

$sort -k1,1 -k2,2n -k3,3n columns.txt
version1.1    5   8
version1.1    10  20
version1.1    10  30
version1.1    40  50
version1.2    10  25
version1.2    30  50
version1.2    40  50

按列字段分隔符(delimiter -t选项)排序

缺省情况下,列的分隔符为空格或者选项卡。
但是,我们可以使用sort或者-fiffer-sectrator`选项使用自定义分隔符。

让我们举个例子,使用冒号(:)作为分隔符和'/etc/passwd'文件进行排序。

如果我们要在UID的基础上排序/etc/passwd文件,我们使用以下命令:

$sort -n -t ':' -k3 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
news:x:9:13:news:/etc/news:
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
<---output truncated--->

按月(-m选项)排序

使用"-m""选项,我们可以按月排序。
如果我们有一个包含月份的文件,则按数月排序命令订单。

例如,'onlor.txt'文件包含一个月名列表。

$cat months.txt
sep
august
july
dec
feb
may
jan

我们现在将使用-m选项将"onlor.txt"文件排序。

$sort -M months.txt
jan
feb
may
july
august
sep
dec

对人类可读数字进行排序(-h选项)

排序可以订购人类可读数字,如2k,5g,3m,使用-h或者- numan-numeric-sort选项。

例如,以下文件列表人类可读号码

$cat human_numeric.txt
4G
2K
3M
1G
34K
52M
200M

以下命令使用-h选项来比较和排序人类可读的数字。

$sort -h human_numeric.txt
2K
34K
3M
52M
200M
1G
4G

检查排序输入(-c选项)

SORT命令可以检查输入是否已排序或者不使用-c选项。
如果未对其进行排序,则返回第一个未失制的行。

$sort -c /etc/passwd
sort: /etc/passwd:2: disorder: daemon:x:1:1:daemon:/usr/sbin:/bin/sh

没有任何打印的输入输入:

$sort /etc/passwd | sort -c
$echo $?
0

与其他命令进行排序

排序是文本处理工具,因此可以通过管道从另一个命令的某些输入中的管道使用它。

在以下命令中,我们将尾部命令输出作为排序输入:

$tail /etc/passwd | sort
altair:x:1001:1001:Altair Ibn La Ahad,,,,:/home/altair:/bin/bash
bind:x:120:132::/var/cache/bind:/bin/false
dnsmasq:x:121:65534:dnsmasq,,,:/var/lib/misc:/bin/false
mysql:x:115:129:MySQL Server,,,:/nonexistent:/bin/false
postfix:x:105:126::/var/spool/postfix:/bin/false
igi:x:1000:1000:igi,,,:/home/igi:/bin/bash
smmsp:x:119:131:Mail Submission Program,,,:/var/lib/sendmail:/bin/false
smmta:x:118:130:Mail Transfer Agent,,,:/var/lib/sendmail:/bin/false
sshd:x:117:65534::/var/run/sshd:/usr/sbin/nologin
statd:x:116:65534::/var/lib/nfs:/bin/false

排序可以使用-r选项反转。

允许拍摄另一个例子来按大小按照人类可读格式排序du命令输出,使用以下命令:

$du -h | sort -h