正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文
本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在Linux中,
grep,sed,awk等命令都支持通过正则表达式进行模式匹配。
一串不包含特殊字符的正则表达式匹配它自己,例如:
[xiao@hadoop105 ~]$ cat /etc/passwd | grep xiao xiao:x:1001:1001::/home/xiao:/bin/bash就会匹配所有包含 xiao 的行
1)特殊字符:^
^ 匹配一行的开头,例如:
[xiao@hadoop105 ~]$ cat /etc/passwd | grep ^a adm:x:3:4:adm:/var/adm:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin avahi:x:70:70:Avahi mDNS/DNS-SD Stack:/var/run/avahi-daemon:/sbin/nologin会匹配出所有以a开头的行
2)特殊字符:$
$ 匹配一行的结束,例如
[xiao@hadoop105 ~]$ cat /etc/passwd | grep t$ halt:x:7:0:halt:/sbin:/sbin/halt会匹配出所有以t结尾的行
思考:^$ 匹配什么?答:空行
3)特殊字符:.
. 匹配一个任意的字符,例如
[xiao@hadoop105 ~]$ cat /etc/passwd | grep r..t root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin会匹配包含rabt,rbbt,rxdt,root等的所有行
4)特殊字符:*
* 不单独使用,他和上一个字符连用,表示匹配上一个字符0次或多次,例如
[xiao@hadoop105 ~]$ cat /etc/passwd | grep ro*t root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin rtkit:x:172:172:RealtimeKit:/proc:/sbin/nologin会匹配rt, rot, root, rooot, roooot等所有行
思考:.* 匹配什么?答:任意字符,任意个数
5)特殊字符:[ ]
[ ] 表示匹配某个范围内的一个字符,例如
[6,8]------匹配6或者8
[0-9]------匹配一个0-9的数字
[0-9]*------匹配任意长度的数字字符串
[a-z]------匹配一个a-z之间的字符
[a-z]* ------匹配任意长度的字母字符串
[a-c, e-f]-匹配a-c或者e-f之间的任意字符
[xiao@hadoop105 ~]$ cat /etc/passwd | grep r[a,b,c]*t operator:x:11:0:operator:/root:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin rtkit:x:172:172:RealtimeKit:/proc:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin会匹配rt,rat, rbt, rabt, rbact,rabccbaaacbt等等所有行
6)特殊字符:\
\ 表示转义,并不会单独使用。由于所有特殊字符都有其特定匹配模式,当我们想匹配某
一特殊字符本身时(例如,我想找出所有包含 ‘$’ 的行),就会碰到困难。此时我们就要
将转义字符和特殊字符连用,来表示特殊字符本身,例如
[xiao@hadoop105 ~]$ cat /etc/passwd | grep a\$b就会匹配所有包含 a$b 的行