grep / egrep 工作日常用法总结

grep (global search regular expression(RE)全面搜索正则表达式)是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep家族包括grep、egrep、fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展，支持更多的re元字符， fgrep就是fixed grep或fast grep，它们把所有的字母都看作单词，也就是说，正则表达式中的元字符表示回其自身的字面意义，不再具有其他特殊含义，一般使用较少。linux使用GNU版本的grep。它功能更强，可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。

grep基本语法格式

grep [-acinvABC] 'word' filename
-a ：以文本文件方式进行搜索
-c ：打印符合要求的行数
-i ：忽略大小写
-n ：在输出符合要求的行的同时连同行号一起输出
-v ：打印不符合要求的行
-A ：后跟一个数字（有无空格都可以），例如 –A2则表示打印符合要求的行以及下面两行
-B ：后跟一个数字，例如 –B2 则表示打印符合要求的行以及上面两行
-C ：后跟一个数字，例如 –C2 则表示打印符合要求的行以及上下各两行
正则表达式中：. 表示任意一个字符， * 表示零个或多个前面的字符，^表示行的开始， $表示行的结尾，^$表示空行，[]表示匹配括号任意一个字符，[^字符] 表示除方括号内的字符之外的字符

过滤出带有某个关键词的行并输出行号

grep -n 'root' /etc/passwd
1:root:x:0:0:root:/root:/bin/bash
11:operator:x:11:0:operator:/root:/sbin/nologin

过滤出不带有某个关键词的行并输出行号

grep -nv 'nologin' /etc/passwd
1:root:x:0:0:root:/root:/bin/bash
6:sync:x:5:0:sync:/sbin:/bin/sync
7:shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
8:halt:x:7:0:halt:/sbin:/sbin/halt

过滤出所有包含数字的行

grep '[0-9]' /etc/inittab
# upstart works, see init(5), init(8), and initctl(8).
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you do not have networking)
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
id:3:initdefault:

过滤出所有不包含数字的行

grep -v '[0-9]' /etc/inittab

过滤出不以#开头的行

grep -v '^#' /etc/inittab
id:3:initdefault:

过滤出不以#开头的非空行

grep -v '^#' /etc/crontab |grep -v '^$'
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

过滤出不以字母开头的行

grep '^[^a-zA-Z]' test.txt

过滤出包含非字母的行

grep '[^a-zA-Z]' test.txt

过滤任意一个字符

grep 'r..o' /etc/passwd
operator:x:11:0:operator:/root:/sbin/nologin
gopher:x:13:30:gopher:/var/gopher:/sbin/nologin
vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin

过滤重复字符

grep 'ooo*' /etc/passwd
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin

匹配所有行

grep '.*' /etc/passwd |wc -l
#.*表示零个或多个任意字符，空行也包含在内。

过滤指定字符出现的次数

grep 'o\{2\}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
#{ }表示前面的字符要重复的次数。使用时两边需要加上转义字符 \。{n1,}表示至少n1次。{n1,n2}表示n1至n2次。

egrep筛选一个或一个以上前面的字符

egrep 'o+' test.txt

egrep筛选零个或一个前面的字符

egrep 'o?' test.txt

egrep筛选字符串1或字符串2

egrep 'aaa|ooo' test.txt

egrep中( )的应用

egrep 'r(oo|at)o' test.txt
egrep '(oo)+' test.txt
#用( )表示一个整体，例如(oo)+就表示1个 ‘oo’ 或者多个 ‘oo’

转载请注明：零五宝典 » grep / egrep 工作日常用法总结