JavaScript RegExp 对象

创 RegExp 对象的语法:

直接量语法

/pattern/attributes

创立 RegExp 对象的语法:

var obj=new RegExp(pattern,attributes);

事例1:

 var pattern=/a/;
   document.write(pattern.exec("asdas"));

事例2:

 var obj=new RegExp("a");
   document.write(obj.exec("asdas"));

事例1同事例2的尽结果是同样的;

参数

参数 pattern 是一个字符串,指定了正则表达式的模式要其他正则表达式。

参数 attributes 是一个可选的字符串,包含属性
“g”(执行全局匹配查找所有匹配而非以找到第一个门当户对后止。)、”i”:执行针对大小写不灵活的相当。

“m”:执行多实行匹配。,分别用于指定全局匹配、区分轻重缓急写的相当与多行匹配。ECMAScript
标准化之前,不支持 m
属性。如果 pattern 是正则表达式,而休是字符串,则要看看略该参数。

返回值

一个初的 RegExp
对象,具有指定的模式及标志。如果参数 pattern 是正则表达式而非是字符串,那么
RegExp() 构造函数将因此和指定的 RegExp 相同之模式以及标志创建一个新的 RegExp
对象。

若是无用 new 运算符,而用 RegExp() 作为函数调用,那么它们的表现和用 new
运算符调用时同,只是当pattern 是正则表达式时,它不过回去回 pattern,而不再创建一个初的
RegExp 对象。

抛出

SyntaxError – 如果 pattern 不是法定的正则表达式,或 attributes 含有
“g”、”i” 和 “m” 之外的字符,抛来该特别。

TypeError – 如果 pattern 是 RegExp
对象,但尚无简单 attributes 参数,抛来拖欠大。

RegExp 对象方法:

1、test():检索字符串中指定的值。返回 true 或 false。

var patt1=new RegExp("e");

document.write(patt1.test("The best things in life are free")); 

2、exec():检索字符串中指定的值。返回找到的值,并规定其岗位。

方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。

3、compile():既可转移检索模式,也得长或去第二只参数。

 

var patt1=new RegExp("e");

document.write(patt1.test("The best things in life are free"));

patt1.compile("d");

document.write(patt1.test("The best things in life are free"));

修饰符:

 

1、g:执行全局匹配查找所有匹配而无在找到第一单门当户对后终止;

每当使用 “g” 参数时,exec() 的办事原理如下:

  • 找到第一只 “e”,并蕴藏其岗位
  • 设重复运行 exec(),则从存储的职位上马寻找,并找到下一个
    “e”,并储存其岗位

    var patt1=new RegExp(“e”,”g”);
    do
    {
    result=patt1.exec(“The best things in life are free”);
    document.write(result);
    }
    while (result!=null)

RegExp 对象属性

1:global:RegExp 对象是不是享有标志 g。

2:ignoreCase:RegExp 对象是否富有标志 i。

3:lastIndex:一个平头,标示开始产同样浅匹配的字符起始位置。

4:multiline:RegExp 对象是不是有标志 m;

5:source:正则表达式的源文本。

 

   var obj=new RegExp(/s/);
      document.write(obj.source);

 

支撑正则表达式的 String 对象的主意

1:search()
方法用于检索字符串中指定的子字符串,或探寻和正则表达式相兼容的子字符串。

忽略大小写事例:

 

<script type="text/javascript">

var str="Visit W3School!"
document.write(str.search(/w3school/i))

</script>

 

返回值

stringObject 中率先单和 regexp 相兼容的子串的前奏位置。

诠释:如果没有找到另外匹配的子串,则赶回 -1。

说明

search() 方法不履全局匹配,它将忽略标志 g。它同时忽略 regexp 的
lastIndex 属性,并且连续由字符串的初步开展搜索,这意味其连接回到
stringObject 的首先个门当户对的职。

 

2:match()
方法而每当字符串内寻找指定的价值,或找到一个要么多独正则表达式的配合。该方式类似
indexOf() 和 lastIndexOf(),但是它回到指定的价值,而非是字符串的位置。

返回值

存匹配结果的数组。该数组的始末因让 regexp 是否持有全局标志 g。

说明

match() 方法将追寻字符串 stringObject,以找到一个要么多单跟 regexp
匹配的文书。这个点子的作为于深酷程度上在 regexp 是否具备标志 g。

一旦 regexp 没有标明 g,那么 match() 方法就不得不于 stringObject
中执行同样次等匹配。如果没有找到另外匹配的文件, match() 将返回
null。否则,它以回来一个数组,其中存放了与她找到的相当文本有关的音。该数组的第
0
单因素存放的是配合文本,而别的元素存放的凡同正则表达式的子表达式匹配的公文。除了这些健康的数组元素外,返回的数组还蕴藏一定量只对象属性。index
属性声明的是配合文本的发端字符在 stringObject 中的职,input
属性声明的是本着 stringObject 的援。

设 regexp 具有标志 g,则 match() 方法以行全局检索,找到 stringObject
中之具有匹配子字符串。若没有找到另外匹配的子串,则赶回
null。如果找到了一个还是多独门当户对配子串,则回一个数组。不过全局匹配返回的数组的情节和前者大不相同,它的数组元素被存放的是
stringObject 中保有的匹配子串,而且为未尝 index 属性或 input 属性。

注意:在大局检索模式下,match()
即不提供与子表达式匹配的文书的音,也非声明每个匹配子串的职务。如果您得这些全局检索的音讯,可以以
RegExp.exec()。

参数为字符串的事例:

 

var str="Hello world!"
document.write(str.match("world") + "<br />")

参数为正则表达式的例子:

 

 

var str="1 plus 2 equal 3"
document.write(str.match(/\d+/g))

3:replace()
方法用于在字符串中用一些字符替换另一对字符,或调换一个及正则表达式匹配的子串。

 

stringObject.replace(regexp/substr,replacement)
参数 描述
regexp/substr

必需。规定子字符串或要替换的模式的 RegExp 对象。

请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。

replacement 必需。一个字符串值。规定了替换文本或生成替换文本的函数。

返回值

一个初的字符串,是因此 replacement 替换了 regexp
的第一糟匹配或享有匹配之后得到的。

说明

字符串 stringObject 的 replace() 方法执行之是寻觅并替换的操作。它用当
stringObject 中检索和 regexp
相兼容的子字符串,然后用 replacement 来替换这些子串。如果 regexp
具有全局标志 g,那么 replace()
方法将替换所有匹配的子串。否则,它只有替换第一只门当户对配子串。

replacement 可以是字符串,也足以是函数。如果她是字符串,那么每个匹配都拿由字符串替换。但是
replacement 中之 $
字符具有一定的意义。如下表所示,它说明从模式匹配得到的字符串将用以替换。

字符 替换文本
$1、$2、…、$99 与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
$& 与 regexp 相匹配的子串。
$` 位于匹配子串左侧的文本。
$’ 位于匹配子串右侧的文本。
$$ 直接量符号。

留神:ECMAScript v3 确定,replace() 方法的参数 replacement
可以是函数而未是字符串。在这种场面下,每个匹配都调用该函数,它回到的字符串将用作替换文本以。该函数的首先只参数是配合模式之字符串。接下来的参数是跟模式面临之子表达式匹配的字符串,可以有
0 单或多单如此的参数。接下来的参数是一个整数,声明了相当在 stringObject
中冒出的职务。最后一个参数是 stringObject 本身。

字符串替换:

var str="Visit Microsoft!"
document.write(str.replace(/Microsoft/, "W3School"))

全局替换:

var str="Welcome to Microsoft! "
str=str + "We are proud to announce that Microsoft has "
str=str + "one of the largest Web Developers sites in the world."

document.write(str.replace(/Microsoft/g, "W3School"))

返回的结果:Welcome to W3School! We are proud to announce that W3Schoolhas one of the largest Web Developers sites in the world.

使用正则表达式:

name = '"a", "b"';
name.replace(/"([^"]*)"/g, "'$1'");

使用函数:

name = 'aaa bbb ccc';
uw=name.replace(/\b\w+\b/g, function(word){
  return word.substring(0,1).toUpperCase()+word.substring(1);}
  );

4:split() 方法用于把一个字符串分割成字符串数组。

语法

stringObject.split(separator,howmany)
参数 描述
separator 必需。字符串或正则表达式,从该参数指定的地方分割 stringObject。
howmany 可选。该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度。

返回值

一个字符串数组。该数组是通过当 separator 指定的边界处将字符串
stringObject
分割成子串创建的。返回的数组中之配串不包括 separator 自身。

但是,如果 separator 是管含子表达式的正则表达式,那么回的数组中概括同这些子表达式匹配的字串(但切莫包括与合正则表达式匹配的公文)。

提示和注释

注:如果将空字符串 (“”) 用作 separator,那么 stringObject
中的每个字符中都见面受剪切。

诠释:String.split()
执行之操作与 Array.join 执行的操作是反的。

修饰符

修饰符 描述
i 执行对大小写不敏感的匹配。
g 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m 执行多行匹配。

方括号

方括号用于查找某个范围外的字符:

表达式 描述
[abc] 查找方括号之间的任何字符。
[^abc] 查找任何不在方括号之间的字符。
[0-9] 查找任何从 0 至 9 的数字。
[a-z] 查找任何从小写 a 到小写 z 的字符。
[A-Z] 查找任何从大写 A 到大写 Z 的字符。
[a-Z] 查找任何从小写 a 到大写 Z 的字符。
[adgk] 查找给定集合内的任何字符。
[^adgk] 查找给定集合外的任何字符。
[red|blue|green] 查找任何指定的选项。

元字符

老大字符(Metacharacter)是怀有非常意义的字符:

元字符 描述
. 查找单个字符,除了换行和行结束符。
\w 查找单词字符。
\W 查找非单词字符。
\d 查找数字。
\D 查找非数字字符。
\s 查找空白字符。
\S 查找非空白字符。
\b 查找位于单词的开头或结尾的匹配。
\B 查找不处在单词的开头或结尾的匹配。
\0 查找 NUL 字符。
\n 查找换行符。
\f 查找换页符。
\r 查找回车符。
\t 查找制表符。
\v 查找垂直制表符。
\xxx 查找以八进制数 xxx 规定的字符。
\xdd 查找以十六进制数 dd 规定的字符。
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符。

量词

量词 描述
n+ 匹配任何包含至少一个 n 的字符串。
n* 匹配任何包含零个或多个 n 的字符串。
n? 匹配任何包含零个或一个 n 的字符串。
n{X} 匹配包含 X 个 n 的序列的字符串。
n{X,Y} 匹配包含 X 或 Y 个 n 的序列的字符串。
n{X,} 匹配包含至少 X 个 n 的序列的字符串。
n$ 匹配任何结尾为 n 的字符串。
^n 匹配任何开头为 n 的字符串。
?=n 匹配任何其后紧接指定字符串 n 的字符串。
?!n 匹配任何其后没有紧接指定字符串 n 的字符串。
更多内容