ECMAScriptJS基础篇–JS正则表达式详解

正则表达式非常有因此,查找、匹配、处理字符串、替换和转移字符串,输入输出等。下面整理一些常用之正则表达式。

常用之正则字符

1.\ :
将下一个字符标记为一个特殊字符、或一个原义字符、或一个
向后引用、或一个八进制转义符。例如,’n’ 匹配字符 “n”。’n’
匹配一个换行符。序列 ‘\’ 匹配 “” 而 “(” 则匹配 “(“。

2.^:匹配输入字符串的启幕位置。如果设置了
RegExp 对象的 Multiline 属性,^ 也匹配配 ‘n’ 或 ‘r’ 之后的职。

3.$:匹配输入字符串的完结位置。如果安了RegExp
对象的 Multiline 属性,$ 也相当配 ‘n’ 或 ‘r’ 之前的职。

4.*:匹配前面的子表达式零次或数。例如,zo 能匹配
“z” 以及 “zoo”。
 等价于{0,}。

5.+:匹配前面的子表达式一糟或频繁。例如,’zo+’
能配合配 “zo” 以及 “zoo”,但不可知配合配 “z”。+ 等价于 {1,}。

6.?:匹配前面的子表达式零次或一致糟糕。例如,”do(es)?”
可以匹配 “do” 或 “does” 中之”do” 。? 等价于 {0,1}。

7.{n}:n 是一个非负整数。匹配确定的 n
次。例如,’o{2}’ 不克配合配 “Bob” 中之 ‘o’,但是能够匹配配 “food” 中的简单只
o。

8.{n,}:n 是一个非负整数。至少匹配n
次。例如,’o{2,}’ 不可知匹配配 “Bob” 中的 ‘o’,但亦可配合配 “foooood” 中的富有
o。’o{1,}’ 等价于 ‘o+’。’o{0,}’ 则相当于于 ‘o*’。

9.{n,m}:m 和 n 均为非负整数,其中n
<= m。最少匹配 n 次还极多匹配 m 次。例如,”o{1,3}” 将匹配配 “fooooood”
中之前方三单 o。’o{0,1}’ 等价于
‘o?’。请留意在逗号和一定量独数里面未克发出空格。

10.?:当该字符紧跟在外一个另限制符
(*, +, ?, {n}, {n,}, {n,m})
后面时,匹配模式是非贪婪之。非贪婪模式尽可能少的配合所搜索的字符串,而默认的贪欲模式则尽量多的配合所搜索的字符串。例如,对于字符串
“oooo”,’o+?’ 将匹配单个 “o”,而 ‘o+’ 将配合有 ‘o’。

11.·:匹配除 “n”
之外的另单个字符。要配合包括 ‘n’ 在内的任何字符,请用象 ‘[.n]’
的模式。

12.(pattern):匹配 pattern
并赢得这等同匹配。所获得的配合可以于发生的 Matches 集合得到,在VBScript
中动用 SubMatches 集合,在JScript 中虽以 $0…$9
属性。要配合圆括声泪俱下字符,请动 ‘(‘ 或 ‘)’。

13.(?:pattern):匹配 pattern
但未取匹配结果,也就是说这是一个休得到匹配,不进行仓储供之后用。这当使用
“或” 字符 (|) 来组合一个模式的次第组成部分是充分有因此。例如, ‘industr(?:y|ies)
就是一个于 ‘industry|industries’ 更简便的表达式。

14.(?=pattern):正为预查,在其它匹配
pattern
的字符串开始处匹配查找字符串。这是一个未得到匹配,也就是说,该匹配不需得到供之后用。例如,’Windows
(?=95|98|NT|2000)’ 能配合配 “Windows 2000” 中的 “Windows” ,但切莫可知配合配
“Windows 3.1” 中之
“Windows”。预查不吃字符,也就是说,在一个相当有后,在最终一赖匹配之后随即开始产一样不好匹配的摸,而非是于包含预查的字符之后开。

15.(?!pattern):负向预查,在另不匹配配
pattern
的字符串开始处匹配查找字符串。这是一个不得到匹配,也就是说,该匹配不欲获得供下采取。例如’Windows
(?!95|98|NT|2000)’ 能匹配配 “Windows 3.1” 中之 “Windows”,但切莫可知匹配配
“Windows 2000” 中的
“Windows”。预查不吃字符,也就是说,在一个相当有后,在最终一糟糕匹配之后就开始下一样蹩脚匹配的物色,而不是自包含预查的字符之后开始

16.x|y:匹配 x 或 y。例如,’z|food’
能匹配 “z” 或 “food”。'(z|f)ood’ 则匹配 “zood” 或 “food”。

17.[xyz]:字符集合。匹配所蕴藏的肆意一个字符。例如,
‘[abc]’ 可以匹配 “plain” 中的 ‘a’。

18.[^xyz]:负值字符集合。匹配未含的擅自字符。例如,
‘1’ 可以匹配 “plain” 中之’p’。

19.[a-z]:字符范围。匹配指定范围外之随机字符。例如,'[a-z]’
可以匹配 ‘a’ 到 ‘z’ 范围外之肆意小写字母字符。

20.[^a-z]:负值字符范围。匹配任何不在指定范围外之轻易字符。例如,’2′
可以匹配任何不在 ‘a’ 到 ‘z’ 范围外之人身自由字符。

21.\b:匹配一个单词边界,也尽管是因单词和空格中的职位。例如,
‘erb’ 可以匹配”never” 中之 ‘er’,但无可知匹配配 “verb” 中之 ‘er’。

22.\B:匹配非单词边界。’erB’ 能配合配
“verb” 中的 ‘er’,但无克配合配 “never” 中的 ‘er’。

23.\cx:匹配由 x 指明的控制字符。例如,
cM 匹配一个 Control-M 或掉车符。x 的价必须也 A-Z 或 a-z 之一。否则,将 c
视为一个原义的 ‘c’ 字符。

24.\d:匹配一个数字字符。等价于
[0-9]。

25.\D:匹配一个非数字字符。等价于 3。

26.\f:匹配一个换页符。等价于 x0c 和
cL。

27.\n:匹配一个换行符。等价于 x0a 和
cJ。

28.\r:匹配一个回车符。等价于 x0d 和
cM。

29.\s:匹配任何空白字符,包括空格、制表符、换页符等等。等价于
[ fnrtv]。

30.\S:匹配任何非空白字符。等价于 4。

31.\t:匹配一个制表符。等价于 x09 和
cI。

32.\v:匹配一个垂直制表符。等价于 x0b
和 cK。

33.\w:匹配包括下划线的别样单词字符。等价于'[A-Za-z0-9_]’。

34.\W:匹配任何非单词字符。等价于
‘5’。

35.\xn:匹配 n,其中 n
为十六进制转义值。十六进制转义值必须也确定的少只数字长。例如,’x41′ 匹配
“A”。’x041′ 则等价于 ‘x04’ & “1”。正则表达式中可使 ASCII
编码。

36.\num:匹配 num,其中 num
是一个刚好整数。对所取得之配合的援。例如,'(.)1′
匹配两个连的相同字符。

37.\n:标识一个八进制转义值或一个朝后引用。如果
n 之前至少 n 个获之子表达式,则 n 为往后引用。否则,如果 n
为八进制数字 (0-7),则 n 为一个八进制转义值。

38.\nm:标识一个八进制转义值或一个通向后引用。如果
nm 之前至少发生 nm 个得到子表达式,则 nm 为于后引用。如果 nm 之前至少发生 n
个得到,则 n 为一个后和文字 m 的向阳后引用。如果面前的标准还不饱,若 n
和 m 均为八进制数字 (0-7),则 nm 将匹配八进制转义值 nm。

39.\nml:如果 n 为八进制数字 (0-3),且 m
和 l 均为八进制数字 (0-7),则匹配八进制转义值 nml。

RegExp类型

ECMAScript通过RegExp种支持正则表达式,如下:

var expression = /pattern/flags;

中间的模式(pattern)有的足是别简单或者复杂的正则表达式,可以蕴涵字符类、限定符、分组、向前查找和反向引用。每个正则表达式可含蓄一个还是基本上个号(flags),用以标明正则表达式的表现。有三独瞬间标明:

  • g:表示全局模式,即模式将受采用到独具字符串,而休在发现第一个门当户对配项时这停下。

  • i:表示不分轻重缓急写模式。

  • m:表示多行模式,即在到达一行文本末尾时还于继续搜寻下一行中是不是有被模式匹配的起。

正则表达式定义方式

为字面量的款型来定义正则表达式

比如:匹配第一独bat或者cat,不分轻重缓急写

var pattern = /[bc]at/i;

采取RegExp构造函数

其接受两独参数:一个凡是如配合的字符串模式,另一个凡可选的标志字符串。可以行使字面量定义之别表达式,都可以动用构造函数来定义,还是以上给之例子也条例:

var pattern = new RegExp("[bc]at","i");

注意 style=”color: #ff0000;”>:RegExp构造函数模式参数时字符串,所以重复某些情况下一旦针对字符进项双重转义。所有元字符都必须再次转义,如许面量模式吧 style=”color: #ff0000;”>/\[bc\]at/,那么当价格的字符串为 style=”color: #ff0000;”>"/\\[bc\\]at/"

例子:

var re = null,
    i;
    for(i=0; i < 10; i++){
        re = /cat/g;
        console.log(re.test("catastrophe"));
    }
    for(i=0; i < 10; i++){
        re = new RegExp("cat","g");
        console.log(re.test("catastrophe"));
    }

打印结果还也10个true

正则表达式方法

RegExp对象的exec()方法

该方法是特地为捕获组而计划的,其接受一个参数,即如利用模式的字符串,然后回包含第一个门当户对项信息的数组;或者以没有匹配项的景象下回到null。返回的数组虽然是Array的实例,但是包含两独附加的性能:indexinput。其中index意味着相当配项在字符串中的职务,而input代表以字符串表达式的字符串。
例:

var text = "mom and dad and baby";
var pattern = /mom( and dad( and baby)?)?/gi;
var matches = pattern.exec(text);
console.log(matches.index); //0
console.log(matches.input); //mom and dad and baby
console.log(matches[0]);    //mom and dad and baby
console.log(matches[1]);    //and dad and baby
console.log(matches[2]);    //and baby

对于exec()法而言,即使以模式被安了全局标志g,它每次也只是返回一个配合配项。在非设置全局标志的场面下,在和一个字符串上反复调用exec()主意将始终返回第一个相当配项的音信。而于设置全局标志的情形下,每次调用exec()则都见面在字符串中继续寻找新匹配项,如下例子:

var text = "cat, bat, sat, fat";
var pattern1 = /.at/;

var matches = pattern1.exec(text);
console.log(matches.index); //0
console.log(matches[0]);  //cat
console.log(pattern1.lastIndex); //0

matches = pattern1.exec(text);
console.log(matches.index); //0
console.log(matches[0]);  //cat
console.log(pattern1.lastIndex); //0

var pattern2 = /.at/g;

var matches = pattern2.exec(text);
console.log(matches.index); //0
console.log(matches[0]);  //cat
console.log(pattern2.lastIndex); //3

var matches = pattern2.exec(text);
console.log(matches.index); //5
console.log(matches[0]);  //bat
console.log(pattern2.lastIndex); //8

style=”font-family: ‘Microsoft YaHei’;”>注意:IEJavaScript实现lastIndex性能上存在错误,即使以非全局模式下,lastIndex特性每次也都于转移。

test()方法

正则表达式常用方法test(),它承受一个字符串参数。在模式和拖欠参数匹配的场面下返回true,否则回false

用法:正则.test(字符串)

例1:判断是否是数字

var str = '374829348791';
var re = /\D/;      //  \D代表非数字
if( re.test(str) ){   // 返回true,代表在字符串中找到了非数字。
    alert('不全是数字');
}else{
    alert('全是数字');
}

例2:

var text ="000-00-0000";
var pattern = /\d{3}-\d{2}-\d{4}/;
if(pattern.test(text)){
    console.log('the pattern was matched.');
}

 search()方法

每当字符串搜索符合正则的始末,搜索到即赶回出现的位置(从0开始,如果配合的不单单是一个假名,那无非会返回第一单字母之位置),
如果搜索失败就是回 -1

用法:字符串.search(正则)

事例:在字符串中搜索字母b,且非分轻重缓急写

var str = 'abcdef';
var re = /B/i;
//var re = new RegExp('B','i'); 也可以这样写
alert( str.search(re) ); // 1

 match方法

得正则相当到之结果,以数组的款型返回

用法:
字符串.match(正则)

例如:

"186a619b28".match(/\d+/g); // ["186","619","28"] 

假设地方的配合不是大局匹配,那么得的结果如下:
["186", index: 0, input: "186a619b28"]

replace方法

replace
本身是JavaScript字符串对象的一个方,它同意收取两单参数:

replace([RegExp|String],[String|Function])

第1只参数可以是一个普通的字符串或是一个正则表达式.
第2单参数可以是一个通常的字符串或是一个回调函数.

苟第2个参数是回调函数,每匹配到一个结果就是回调一不成,每次回调都见面传递以下参数:

  • result:
    本次匹配到之结果

  • $1,…$9:
    正则表达式中发出几只(),就见面传递几独参数,$1~$9分别表示本次匹配中每个()提取的结果,最多9只

  • offset:记录本次匹配的初步位置

  • source:接受匹配的原始字符串

以下是replace和JS正则搭配以的几乎独周边经案例:

(1)实现字符串的trim函数,去除字符串两限的空格

String.prototype.trim = function(){

  //方式一:将匹配到的每一个结果都用""替换
  return this.replace(/(^\s+)|(\s+$)/g,function(){
    return "";
  });

  //方式二:和方式一的原理相同
  return this.replace(/(^\s+)|(\s+$)/g,'');
};

^s+
代表坐空格开头的接连空白字符,s+$ 代表因为空格结尾的连接空白字符,加上()
就是拿配合到之结果取出来,由于是 |
的涉及,因此这个表达式最多会match到一定量独结果集,然后实施两破替换:

String.prototype.trim = function(){
  /**
   * @param rs:匹配结果
   * @param $1:第1个()提取结果
   * @param $2:第2个()提取结果
   * @param offset:匹配开始位置
   * @param source:原始字符串
   */
  this.replace(/(^\s+)|(\s+$)/g,function(rs,$1,$2,offset,source){
    //arguments中的每个元素对应一个参数
    console.log(arguments);
  });
};

" abcd ".trim();

出口结果:

[" ", " ", undefined, 0, " abcd "] //第1次匹配结果
[" ", undefined, " ", 5, " abcd "] //第2次匹配结果

(2)提取浏览器url中之参数誉为及参数值,生成一个key/value的目标

function getUrlParamObj(){
  var obj = {};
  //获取url的参数部分
  var params = window.location.search.substr(1);
  //[^&=]+ 表示不含&或=的连续字符,加上()就是提取对应字符串
  params.replace(/([^&=]+)=([^&=]*)/gi,function(rs,$1,$2){
    obj[$1] = $2;
  });

  return obj;
}

/([^&=]+)=([^&=]*)/gi 每次匹配到的且是一个完整key/value,形如xxxx=xxx,
每当匹配到一个这么的结果时虽行回调,并传递匹配到的keyvalue,对应到$1$2

(3)在字符串指定位置插入新字符串

String.prototype.insetAt = function(str,offset){

  //使用RegExp()构造函数创建正则表达式
  var regx = new RegExp("(.{"+offset+"})");

  return this.replace(regx,"$1"+str);
};

"abcd".insetAt('xyz',2); //在b和c之间插入xyz
//结果 "abxyzcd"

offset=2常常,正则表达式为:(^.{2}) .表示除\n外界的随意字符,后面加{2} 就是相当以数字或者字母组成的眼前片个连字符,加()即使会以相当到之结果取出来,然后经过replace拿相当到之结果替换为新的字符串,形如:结果=结果+str

(4)
将手机号12988886666转账成为129 8888 6666

function telFormat(tel){

  tel = String(tel);

  //方式一
  return tel.replace(/(\d{3})(\d{4})(\d{4})/,function (rs,$1,$2,$3){
    return $1+" "+$2+" "+$3
  });

  //方式二
  return tel.replace(/(\d{3})(\d{4})(\d{4})/,"$1 $2 $3");
}

(\d{3}\d{4}\d{4}) 可以配合完的手机号,并各自领到前3员、4-7位和8-11位,"$1 $2 $3" 是在三个结果集中间加空格组成新的字符串,然后替换完整的手机号。

 

(5)replace()方法全局替换变量

 

简单替换字符:string.replace("a","b"); (把 a
替换成 b)
全局替换字符:string.replace(/a/g,"b");(全局把a替换成b)

 

可是若是全局替换一个变量内容,如下,给一个电话号码中间加*号

var phone = "15512345678";
var sliceNumber = phone.slice(3,phone.length - 3);
var newPhone = phone.replace(new RegExp(sliceNumber,'g'),'****');
console.log(newPhone); //155****678

 

常用实例

相当第一只bat或者cat,不区分轻重缓急写:/[bc]at/i 或者 new RegExp("[bc]at","i");

配合有坐”at”结尾的3单字符组合,不分轻重缓急写:/.at/gi;

特能够输入数字:^[0-9]*$;

单单会输入n位的数字:^\d{n}$

不过会输入至少n位的数字:^\d{n,}$

单独会输入m~n号的数字:^\d{m,n}$

唯有会输入零以及不零始的数字:^(0|[1-9][0-9]*)$

无非能够输入有点儿个小数的正实数:^[0-9]+(.[0-9]{2})?$

单纯能够输入有1~3号小数的正实数:^[0-9]+(.[0-9]{1,3})?$

只能够输入非零的正整数:^\+?[1-9][0-9]*$

单会输入长度为3底字符:^.{3}$

光会输入由26单英文字母组成的字符串:^[A-Za-z]+$

就会输入由数字和26独英文字母组成的字符串:^[A-Za-z0-9]+$

才能够输入由数字、26只英文字母或者下划线组成的字符串:^\w+$

征用户密码:以字母开头,长度在6~18期间,只能分包字符、数字与下划线:^[a-zA-Z]\w{5,17}$

征是否含有^%&’,;=?$”等字符:[^%&',;=?$\x22]+

无非能够输入汉字:^[\u4e00-\u9fa5]{0,}$

验证Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

证明身份证号(15各还是18各数字):^\d{15}|\d{18}$

验证IP地址:^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)$

相当两个少于个重叠出现的字符
例如,”aabbc11asd”, 返回结果吧aa bb 11叔组match:(\w)\1

匹配成对的HTML标签:<(?<tag>[^\s>]+)[^>]*>.*</\k<tag>>

匹配1-58里边的数字:/^([1-9]|[1-5][0-8])$/

配合配 -90至90期间的平头(包括-90跟90):^(-?[1-8][0-9]|-?[1-9]|-?90|0)$

匹配配收尾空白字符:^\s+|\s+$

中文,全角,半角匹配:

 str="中文;;a"    
  alert(str.match(/[\u0000-\u00ff]/g))     //半角  
  alert(str.match(/[\u4e00-\u9fa5]/g))     //中文  
  alert(str.match(/[\uff00-\uffff]/g))     //全角

搜寻重复项极其多之字符个数:

var str = 'assssjdssskssalsssdkjsssdss';

var arr = str.split(''); //把字符串转换为数组
str = arr.sort().join(''); //首先进行排序,这样结果会把相同的字符放在一起,然后再转换为字符串
//alert(str);  // aaddjjkklsssssssssssssssss

 var value = '';
 var index = 0; 
var re = /(\w)\1+/g;  //匹配字符,且重复这个字符,重复次数至少一次。
str.replace(re,function($0,$1){ 
   //alert($0);   代表每次匹配成功的结果 : aa dd jj kk l sssssssssssssssss
     //alert($1);  代表每次匹配成功的第一个子项,也就是\w:  a d j k l S 
  
    if(index<$0.length){  //如果index保存的值小于$0的长度就进行下面的操作
          index = $0.length;  // 这样index一直保存的就在最大的长度
           value = $1;  //value保存的是出现最多的这个字符
    }

}); 

alert('最多的字符:'+value+',重复的次数:'+index);  // s   17

判定是休是QQ号:

//^ :
放在正则的太开始位置,就意味着起始之意思,注意  /[^a] /   和  
/^[a]/是免一样的,前者是割除之意,后者是代表首员。

//$ :
正则的末段位置 , 就表示了之意

 

//首先想QQ号的规则 
      1 首位不能是0 
      2 必须是 5-12位的数字

    var aInput = document.getElementsByTagName('input');
    var re = /^[1-9]\d{4,11}$/;
    //123456abc为了防止出现这样的情况,所以必须限制最后
    //首位是0-9,接着是4-11位的数字类型。
aInput[1].onclick = function(){
    if( re.test(aInput[0].value) ){
        alert('是QQ号');
    }else{
        alert('不是QQ号');
    }

};

 

免前后空格(面试题经常出现):

var str = '  hello  ';
alert( '('+trim(str)+')' );//为了看出区别所以加的括号。 (hello)
function trim(str){
   var re = /^\s+|\s+$/g; // |代表或者   \s代表空格  +至少一个    前面有至少一个空格 或者后面有至少一个空格 且全局匹配
  return str.replace(re,''); //把空格替换成空
}

常用之局部表单校验:

匹配中文:[\u4e00-\u9fa5] //中文ACALL码的范围
行首行尾空格:^\s*|\s*$ //首行出现任意个空格或者尾行出现任意个空格(任意表示也可以没有空格)

Email:^\w+@[a-z0-9]+(\.[a-z]+){1,3}$  
      //起始至少为一个字符(\w字母,数字或者下划线),然后匹配@,接着为任意个字母或者数字,\.代表真正的点,.后面为至少一个的字符(a-z),同时这个(比如.com)整体为一个子项作为结束,可以出现1-3次。因为有的邮箱是这样的.cn.net。(xxxx.@qq.com xxxx.@163.com xxxx.@16.cn.net )

网址:[a-zA-z]+://[^\s]*   http://......
  //匹配不分大小写的任意字母,接着是//,后面是非空格的任意字符

邮政编码:[1-9]\d{5}  //起始数字不能为0,然后是5个数字
身份证:[1-9]\d{14}|[1-9]\d{17}|[1-9]\d{16}x

 可参考地址:
通晓
JS正则表达式
通晓正则表达式- 读书笔记

过目不忘JS正则表达式