如何对多个字符串和模式进行Grep

时间:2020-03-05 15:26:54  来源:igfitidea点击:

“ grep”是一种功能强大的命令行工具,可让我们在一个或者多个输入文件中搜索与正则表达式匹配的行,并将每条匹配的行写入标准输出。

在本文中,我们将向我们展示如何使用GNU'grep'搜索多个字符串或者模式。

Grep多种模式

GNU'grep'支持三种正则表达式语法,Basic,Extended和Perl兼容。
如果未指定任何正则表达式类型,则'grep'会将搜索模式解释为基本正则表达式。

要搜索多个模式,请使用OR(交替)运算符。

交替运算符“ |” (竖线)允许我们指定不同的可能匹配项,这些匹配项可以是文字字符串或者表达式集。
在所有正则表达式运算符中,此运算符的优先级最低。

使用'grep'基本正则表达式搜索多个模式的语法如下:

grep 'pattern1\|pattern2' file...

始终将正则表达式括在单引号中,以避免shell解释和扩展元字符。

使用基本正则表达式时,元字符将解释为文字字符。
为了保留元字符的特殊含义,必须使用反斜杠('')对其进行转义。
这就是为什么我们用斜杠转义OR运算符('|')的原因。

要将模式解释为扩展的正则表达式,请调用'grep'-'E'(或者'--extended-regexp')选项。
使用扩展的正则表达式时,请勿转义'|'运算符:

grep -E 'pattern1|pattern2' file...

有关如何构造正则表达式的更多信息,请查看我们的文章Grep regex。

Grep多个字符串

文字字符串是最基本的模式。

在以下示例中,我们正在Nginx日志错误文件中搜索单词'fatal','error'和'critical'的所有出现:

grep 'fatal\|error\|critical' /var/log/nginx/error.log

如果要搜索的字符串包含空格,请将其用双引号引起来。

这是使用扩展的正则表达式的相同示例,它消除了对运算符'|'进行转义的需要

grep -E 'fatal|error|critical' /var/log/nginx/error.log

默认情况下,“ grep”区分大小写。
这意味着将大写和小写字符视为不同的字符。

要在搜索时忽略大小写,请使用'-i'选项(或者'--ignore-case')调用'grep':

grep -i 'fatal\|error\|critical' /var/log/nginx/error.log

搜索字符串时,“ grep”将显示该字符串嵌入较大字符串中的所有行。
因此,如果我们要搜索“错误”,则“ grep”还将打印“错误”内含较大字词的行,例如“无错误”或者“反恐分子”。

要仅返回指定字符串是整个单词(用非单词字符括起来)的那些行,请使用'-w'(或者'--word-regexp')选项:

grep -w 'fatal\|error\|critical' /var/log/nginx/error.log

文字字符包括字母数字字符(a-z,A-Z和0-9)和下划线(_)。
所有其他字符均视为非单词字符。