linux 正则表达式grep实例分析_正则表达式

来源:脚本之家  责任编辑:小易  

linux grep命令 命令本来是ed行编辑器中的一个php?name=%C3%FC%C1%EE" onclick="tagshow(event)"class="t_tag">命令/过滤器:g/re/p-global-regular expression-print.基本格式 grep pattern[file.](1)grep 搜索字符串[filename]www.zgxue.com防采集请勿采集本网。

在很多技术领域(如:自然语言处理,数据存储等),正则表达式可以很方便的提取我们想要的信息,所以正则表达式是一个很重要的知识点!

可以使用,grep检索的强大在于它的多样性匹配,正则表达式是这个的标准玩法

一、概念

不知道我的没有输出01 31 你的文本里是不是不止这一条Last Changed Rev:估计有三条,全grep出来了 如果只有一条,下面方法随便用那个都行,如果只是打算截取最后那窜数字的话。awk '/Last Changed Rev/{

正则表达式(Regular Expression)是用于描述一组字符串特征的模式,用来匹配特定的字符串。通过特殊字符+普通字符来进行模式描述,从而达到文本匹配目的工具。

grep-P 'Regular expressions' 其中 P 告诉grep使其支持perl正则表达式 'Regular expressions' 此处就是perl正则表达式 具体的语法跟perl中的一模一样

正则表达式目前被集成到了各种文本编辑器/文本处理工具当中

如果能够确定 两个ng 在55的前面,可以用 ls|grep-n '[S|s]h.*\\(ng\\).*\\1.*55.*\\.sql'

二、应用场景

这是你在shell里输入的吧,这个*在shell里属于shell的globbing模式,而不适正则的意思。(参见mastering RE) sed 's/*/g' file 这里的 '.' 是给sed传递的参数,被用于正则处理。所以这里的*才是正则里的

(1)验证:表单提交时,进行用户名密码的验证。

(2)查找:从大量信息中快速提取指定内容,在一批url中,查找指定url。

(3)替换:将指定格式的文本进行正则匹配查找,找到之后进行特定替换。

三、基本要素

(1)字符类

(2)数量限定符

(3)位置限定符

(4)特殊符号

注意:正则表达式基本是与语言无关的,我们可以结合语言/工具与正则表达式进行文本处理,在后面的博客中,我将使用grep来进行验证。(grep是一款Linux下按行匹配文本的工具,如下,使我们常使用的两个选项)

-E:使用扩展正则匹配

--color:将匹配得到的内容进行语法高亮

1.字符类

举例如下:

例1:

注意:1.grep采用的贪心匹配,它会匹配当前行中的所有匹配内容

2.echo $?表示是否匹配成功(如果成功返回值为0,不成功返回值为1)

例2:

例3:

例4:

例5:

2.数量限定符

举例如下:

例1:

例2:

由此,我们可以看出,“前面的单元”默认是指?或+前面的字符

例3:

例4:

例5:

例6:

注意:该结果为匹配失败,在相关文档中并未出现,应该啊是错误或者废弃的用法

例7:

3.位置限定符

举例如下:

例1:

例2:

例3:

例4:

例5:

例6:

4.特殊符号

举例如下:

假如我们去掉-E选项,会有什么现象呢?

此时,不难发现,去掉-E选项之后没有进行正常的正则匹配,这种现象需要我们引入如下的两个概念!

5.基本正则表达式&扩展正则表达式

区别:正则表达式的扩展正则(Extended规范)和基本正则(Basic规范)下,有些字符应该解释为普通字符,要表示上述特殊含义则需要加“\”转义字符。反之,在扩展规范下,应被理解为特殊含义,要取其字面值,也要对其进行“\”转义。

因此,grep工具带上-E选项,表示使用扩展正则来进行匹配,若没有该选项,则表示使用基准正则来进行匹配。

对于上述的问题,我们举例如下:

例1:

例2:当目标字符串当中本身就包含了字符,要想进行正则匹配,应该这样做:

例3:

5.其他普通字符集及其替换

举个例子:

综上,正则表达式有以下三个分类:

(1)基本正则表达式:Basic即BPEs

(2)扩展正则表达式:Extended即EREs

(3)Perl的正则表达式:PREs

因此,当grep指令不跟任何参数时,表示要使用BREs,后面跟“-E”表示使用EREs,后面跟“-P”参数,表示使用PREs

四、贪婪模式与非贪婪模式

1.贪婪模式:正则表达式匹配时,会尽量多的匹配符合条件的内容

举例如下:

注意:grep默认采用贪婪匹配,可能会对我们的测试结果造成干扰,大家可以上网使用“正则在线转换工具”进行测试

2.非贪婪模式:正则表达式匹配时,会尽量少的匹配符合条件的内容,也就是说,一旦发现匹配符合要求,立马就匹配成功,而不会继续匹配下去(除非有g,开启下一组匹配)

举例如下:

五、零宽断言

1.所谓断言,是用来声明一个应该为真的事实。在正则表达式中,只有当断言为真时才会继续进行匹配。

2.零宽断言:像用于查找某些内容之前或者之后的东西,其中一些特殊字符如“\b、^、$”等用于指定一个位置,这个位置应满足一定的条件。

3.分类:

(1)零宽度正预测先行断言(?=exp)

它断言自身出现的位置之后能匹配的表达式exp。如:\b\w+(?=ing\b),表示匹配以ing结尾的单词的前面的部分(除ing以外的部分)。当我们要查找“I'm singing while you're dancing.”时,它会匹配sing和danc

举例如下:

(2)零宽度正回顾后发断言(?>=exp)

它断言自身出现的位置的前面能匹配的表达式exp。如:(?<=\bre)\w+\b会匹配以re开头的单词的后半部分(除er以外的部分),例如:在查找“reading a book”时,它匹配ading

举例如下:

六、简单练习

1.手机号码

2.非零的正整数

3.非零开头的最多带两位小数的数字

4.由数字和26位字母组成的字符串

5.QQ号,从10000开始

6.IP地址

\d+\.\d+\.\d+\.\d+

7.判断账号是否合法

^[a-zA-Z0-9][a-zA-Z0-9_]{4,15}$

8.日期格式

^\d{4}-\d{1,2}-\d{1,2}

正则表达式的学习就到这里结束啦,如果有小伙伴没有看明白的,可以上网查询正则的更多知识点!

cat test.txt|grep-o \\'[0-9\\:a-zA-Z]*\\'内容来自www.zgxue.com请勿采集。


  • 本文相关:
  • linux grep与正则表达式使用介绍
  • linux系统用户管理与grep正则表达式示例教程
  • 浅谈linux grep与正则表达式
  • linux grep正则表达式与grep用法详解
  • linux下关于正则表达式grep的一点总结
  • 正则爬取京东商品信息并打包成.exe可执行程序
  • 循序渐进掌握递归正则表达式【推荐】
  • 用正则表达式过滤html代码
  • python爬虫正则表达式常用符号和方法
  • 正则表达式教程之重复匹配详解
  • sql关键词脚本检查正则表达式的方法
  • 正则表达式+python re模块详解
  • 只能输入正整数的正则表达式及常用的正则表达式
  • eregi_replace()中特殊字符的处理方法
  • java正则表达式提取字符的方法实例
  • Linux grep 正则表达式
  • linux grep正则表达式怎么用
  • linux grep 正则表达式
  • linux grep 正则表达式 请教
  • linux grep不能用正则表达式吗
  • linux,bash下一个grep正则表达式的疑问
  • linux的grep命令,解释一下perl正则表达式在这里怎么用,以及语法
  • grep正则表达式
  • linux中,正则表达式 元字符*代表什么?
  • 初学者问一个Linux正则表达式的语句说明?
  • 网站首页网页制作脚本下载服务器操作系统网站运营平面设计媒体动画电脑基础硬件教程网络安全javascriptasp.netphp编程ajax相关正则表达式asp编程jsp编程编程10000问css/htmlflex脚本加解密web2.0xml/rss网页编辑器相关技巧安全相关网页播放器其它综合dart首页正则表达式linux grep与正则表达式使用介绍linux系统用户管理与grep正则表达式示例教程浅谈linux grep与正则表达式linux grep正则表达式与grep用法详解linux下关于正则表达式grep的一点总结正则爬取京东商品信息并打包成.exe可执行程序循序渐进掌握递归正则表达式【推荐】用正则表达式过滤html代码python爬虫正则表达式常用符号和方法正则表达式教程之重复匹配详解sql关键词脚本检查正则表达式的方法正则表达式+python re模块详解只能输入正整数的正则表达式及常用的正则表达式eregi_replace()中特殊字符的处理方法java正则表达式提取字符的方法实例java 正则表达式详解比较正宗的验证邮箱的正则表达式正则表达式匹配任意字符(包括换最新手机号码、电话号码正则表达javascript 手机号码正则表达式验js利用正则配合replace替换指定字正则表达式匹配不包含某些字符串正则中需要转义的特殊字符小结js正则函数match、exec、test、s最全的常用正则表达式大全——包史上最全正则表达式合集(马上收藏)一个正则的写法 phpjs 正则表达式用法介绍正则表达式教程之前后查找lookaround详解js&vbs正则表达式替换重复的字符javascript正则表达式regexp入门图文教程js正则函数match、exec、test、search、rphp中基于perl的正则表达式处理函数javascript正则表达式下之相关方法javascript正则表达式上之基本语法(推荐)
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved