正则表达式之回乳引用backreference的详细介绍 _ 路由器设置|192.168.1.1|无线路由器设置|192.168.0.1

正则表达式之回乳引用backreference的详细介绍

本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考，具体如下：

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间，有的例子会使用Java来实现，如果是java本身正则表达式的用法，会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、问题引入

一个在HTML页面中匹配标题标签（H1—H6）的问题：

文本：

<body>
<h1>Welcome to my page</H1>
Content is divided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式：<[hH][1-6]>.*?</[hH][1-6]>

结果：

<body>
【<h1>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h2>Introduction</h2>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
【<h2>This is invalid HTML</h3>】
</body>

分析：模式<[hH][1-6]>匹配任何一级标题的开始标签，而且不区分大小写，在这个例子中它匹配到了<h1>、<h2>，</[hH][1-6]>匹配到了</h1>、</h2>、</h3>；这里使用了懒惰型元字符来匹配标签中的文本，否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出，有一个无效的标签也匹配上了，即<h2></h3>，它们根本不能配对。要解决这个问题，就需要使用到回溯引用（backreference）。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用，在前面已经介绍过了。现在来解决前面的例子：

文本：

<body>
<h1>Welcome to my page</H1>
Content is divided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式：<[hH]([1-6])>.*?</[hH]\1>

结果：

分析：首先匹配开始标题标签的模式<[hH]([1-6])>，使用括号把[1-6]做为子表达式，而匹配结束标题标签模式为</[hH]\1>，其中\1表示引用第一个子表达式，即([1-6])，如果([1-6])匹配到的是1，那\1也匹配到1，如果匹配到2，那\1也匹配到2，所以最后一个无效的标题标签就不会被匹配到了。

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：
http://tools.jb51.net/regex/create_reg

希望本文所述对大家JavaScript程序设计有所帮助。

本文地址：http://www.45fan.com/bcdm/90053.html

ES2015正则表达式新增特性有哪些？	Editplus中的正则表达式介绍
Editplus中的正则表达式分析	常用证件号码的正则表达式集锦
15/18位身份证号码验证的正则表达式集锦	bash中用于grep的正则表达式集锦
如何通过正则表达式进行页面表单验证功能	常用的正则表达式匹配数字结合
JSP EL表达式取值过程详细介绍	怎么样利用正则表达式提取固定字符之间的

45fan.com - 路饭网

正则表达式之回乳引用backreference的详细介绍

Tags：表达式学习教程回溯

45fan.com - 路饭网

正则表达式之回乳引用backreference的详细介绍

Tags： 表达式 学习教程 回溯

Tags：表达式学习教程回溯