| 在圆括号中并且通过使用修饰符“{3}”被重复三次,后面跟着与之前一样的表达式而不带后缀部分。
不幸的是,这个例子允许IP地址中被分隔的部分是任意的一位,两位,或三位数字,尽管一个合法的IP地址不能有大于255的数字。要是能够算术比较一个获取的数字N使N<256就好了,但是只用正则表达式是不能够办到的。下一个例子使用模式匹配测试了基于第一位数字的多种可选项来保证限制数字的取值范围。这表明一个表达式会变得很笨重,尽管搜索模式的描述是简单的。
19. ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?) -- IP finder
一个“回引”用来搜索前面被一个分组捕获的已匹配文本的再现。例如,“\1”表示“匹配分组1中已捕获到的文本”。下面是一个例子:
20. \b(\w+)\b\s*\1\b -- Find repeated words
它的运行过程是先捕获一个分组1中“(\w+)”表示的至少包含一个字母数字字符的字符串,但仅当它是一个单词的开始或结束字符时才行。然后它搜索任意数量的空白字符“\s*”后跟以被捕获的文本“\1”结尾的单词。
在上面的例子中,想要替换分组“(\w+)”这种写法,我们可以把它写成“(?<Word>\w+)”来给这个分组命名为“Word”。一个对这个分组的回引可以写成“\k<Word>”。试试下面的例子:
21. \b(?<Word>\w+)\b\s*\k<Word>\b -- Capture repeated word in a named group
通过使用圆括号,有很多可用的特殊用途的语法元素。一些最常用的归纳如下面这张表格:
捕获
(exp)
匹配exp并且在一个自动计数的分组中捕获它
(?<name>exp)
匹配exp并且在一个命名的分组中捕获它
(?:exp)
匹配exp并且不捕获它
察看
(?=exp)
匹配任何后缀exp之前的位置
(?<=exp)
匹配任何前缀exp之后的位置
(?!exp)
匹配任何未找到的后缀exp之后的位置
(?<!exp)
匹配任何未找到的前缀exp之前的位置
评论
(?#comment)
评论
表4 常用分组结构
前两个我们已经说过了。第三个“(?:exp)”不会改变匹配行为,它只是不像前两个那样捕获已命名的或者计数的分组。
确定察看(Positive Lookaround)
下面四个是所谓的前向或后向断言。它们从当前的匹配向前或向后寻找需要的东西而不在匹配中包含它们。这些表达式匹配一个类似于“^”或“\b”的位置而不匹配任何文本,理解这个是很重要的。由于这个原因,他们也被称为“零宽度断言”。最好用例子来解释它们:
“(?=exp)”是“零宽度确定前向断言”。它匹配一个文本中在给定后缀之前的位置,但不在匹配中包含这个后缀:
22. \b\w 上一页 [1] [2] [3] [4] [5] [6] [7] [8] 下一页 |