JavaScript中的RegExp类型

RegExp

ECMAScript 通过 RegExp 类型来支持正则表达式。


创建 RegExp

创建正则表达式语法:

var expression = / pattern / flags ;

其中的模式(pattern)部分可以是任何简单或复杂的正则表达式,可以包含字符类、限定符、分组、向前查找及反向引用。每个正则表达式都可以带有一或多个标志(flags),用以标明正则表达式的行为。

关于正则表达式语法可看这个:正则表达式
正则表达式的匹配模式支持 3 个标志:

  • g:表示全局(global)模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止。
  • i:表示不区分大小写(case-insensitive)模式,即在确定匹配项时忽略模式与字符串的大小写。
  • m:表示多行(multiline)模式,即在到达一行文本末尾时还会继续查找下一行中是否存在与模式匹配的项。

例如:

// 匹配字符串中所有“at”的实例
var pattern1 = /at/g
// 匹配第一个“bat”或者“cat”,不区分大小写
var pattern2 = /[bc]at/i
// 匹配所有的以“at”结尾的 3 个字符的组合,不区分大小写
var pattern3 = /.at/gi

转义

与其他语言中的正则表达式类似,模式中使用的所有元字符都必须转义。正则表达式中的元字符包括:

( [ { \ ^ $ | ) ? * + . ] }

例如:

// 匹配第一个“bat”或者“cat”
var pattern2 = /[bc]at/
// 匹配第一个“[bc]at”
var pattern4 = /\[bc\]at/

RegExp 构造函数

上面的例子都是使用字面量表示法来定义的正则表达式,也可以使用 RegExp 构造函数来定义。构造函数接收两个参数:一个是要匹配的字符串模式,一个是可选的标志字符串。

要注意的是,传递给 RegExp 构造函数的两个参数都是字符串,由于 RegExp 构造函数的模式参数也是字符串,所以在某些情况下要对字符进行双重转义。


RegExp 实例属性

RegExp 的每个实例都具有以下属性,通过这些属性可以取得有关模式的各种信息。

  • global:布尔值,表示是否设置了 g 标志
  • ignoreCase:布尔值,表示是否设置了 i 标志
  • multiline:布尔值,表示是否设置了 m 标志
  • lastIndex:整数,表示开始搜索下一个匹配项的字符位置
  • source:正则表达式的字符串表示,按照字面量形式而非传入构造函数中的字符串模式返回
var pattern = /\[bc\]at/gi

alert(pattern.global)       // true
alert(pattern.ignoreCase)   // true
alert(pattern.multiline)    // false
alert(pattern.lastIndex)    // 0
alert(pattern.source)       // "\[bc\]at"

不论是使用字面量还是构造函数,他们的 source 属性是相同的,都是字面量形式所用的字符串。


RegExp 实例方法

1. exec ( )

exec ( ) 是 RegExp 对象的主要方法,专门为捕获组而设计的。

exec ( ) 接收一个参数,即要应用模式的字符串,然后返回包含第一个匹配项信息的数组;或在没有匹配项的情况下返回 null。

该方法返回的数组虽然是 Array 的实例,但包含两个额外的属性:index 和 input。其中,index 表示匹配项在字符串中的位置,input 表示应用正则表达式的字符串。
在返回的数组中,第一项是与整个模式匹配的字符串,其他项是与模式中的捕获组(不懂捕获组点这里)匹配的字符串(如果没有捕获组,则该数组只包含一项)。

对于 exec ( ) 而言,即使在模式中设置了全局标志(g),他每次也只会返回一个匹配项。在不设置全局标志的情况下,在同一个字符串上多次调用 exec ( ) 将始终返回第一个匹配项的信息。而在设置全局标志的情况下,每次调用 exec ( ) 则都会在字符串中继续查找新匹配项。

例如:

var text = "cat, bat, sat, fat";
var pattern1 = /.at/
var pattern2 = /.at/g

var matches1 = pattern1.exec(text)
alert(matches1.index)       // 0
alert(matches1[0])          // cat
alert(pattern1.lastIndex)   // 0

matches1 = pattern1.exec(text)
alert(matches1.index)       // 0
alert(matches1[0])          // cat
alert(pattern1.lastIndex)   // 0

var matches2 = pattern2.exec(text)
alert(matches2.index)       // 0
alert(matches2[0])          // cat
alert(pattern2.lastIndex)   // 3

matches2 = pattern2.exec(text)
alert(matches2.index)       // 5
alert(matches2[0])          // bat
alert(pattern2.lastIndex)   // 8

在上面的例子中我们也可以发现,lastIndex 属性,在全局模式下每次调用值都会改变,而在非全局模式下则保持不变。

2. test ( )

test( ) 方法接收一个字符串参数,在模式与该参数匹配的情况下返回 true,否则返回 false。

在只想知道目标字符串与某个模式是否匹配,但不需要知道具体文本内容时,一般使用这个方法。因此这个方法常用在 if 语句中。

例如:

var text = "000-00-0000"
var pattern = /\d{3}-\d{2}-\d{4}/

if(pattern.test(text)){
    alert("mateched!")
}

3. 继承方法

  • toString ( ) 和 toLocalString ( ) 这两个方法都会返回正则表达式的字面量,不论是用哪种方式创建。
  • 正则表达式的 valueOf ( ) 方法返回正则表达式本身。
var text = "000-00-0000"
var pattern = /\d{3}-\d{2}-\d{4}/

var valParteen = pattern.valueOf()

alert(pattern.toString())   // /\d{3}-\d{2}-\d{4}/

alert(valParteen)   // /\d{3}-\d{2}-\d{4}/
alert(typeof(valParteen))   // object
alert(valParteen instanceof RegExp) // true

猜你喜欢

转载自blog.csdn.net/TalonZhang/article/details/84885166