本文共 1276 字,大约阅读时间需要 4 分钟。
正则表达式
简介
概念
- RegExp 是正则表达式的缩写
- 当检索某个文本时,可以使用RegExp来描述要检索的内容
- 简单的模式可以是一个单独的字符
- 更复杂的模式包括了更多的字符,并可用于解析、格式检查、替换
- 可以规定字符串中的检索位置,以及要检索的字符类型
作用
- 给定的字符串是否符合正则表达式的过滤逻辑
- 从字符串中获取我们想要的特定部分
- 强大的字符串替换能力
特点
- 灵活性、逻辑性和功能性非常强
- 可以迅速地用极简单的方式达到字符串的复杂控制
返回值
- 一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。
- 如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。
抛出
- SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。
- TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
元字符
- d 匹配数字
- D 匹配非数字
- w 匹配字母数字下划线
- W 匹配非字母数字下划线
- s 匹配空白符
- S 匹配非空白符
- . 除换行符意外的任意字符
- ^ 以什么开始
- $ 以什么结尾
限定符
- * 重复零次或多次
- + 重复一次或多次
- ? 重复零次或一次
- {n} 重复n次
- {n,} 重复n次或多次
- {n,m} 重复n次到m次
元字符串
- [ ] 字符串用中括号括起来,表示匹配其中的任一字符,相当于或的意思
- [ ^] 匹配中括号以内的内容
- 转义符
- | 或者,选择两者中的一个
- ( ) 分组
- [u4e00-u9fa5] 匹配汉字
创建正则对象
- i 忽略大小写
- g 全局匹配
- gi 全局匹配+忽略大小写
正则匹配
正则提取
正则替换
RegExp对象方法
test
exec
- 检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null
- exec()方法可以向 RegExp 对象添加第二个参数,以设定检索
- 在使用g参数时,找到第一个e,并存储其位置,如果再次运行exec(),则从存储的位置开始检索,并找到下一个e,并存储其位置
compile
支持正则表达式的字符串对象方法
search
match
- 找到一个或多个正则表达式的匹配。该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置
replace
- 用于在字符串中,用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。
split
转载地址:http://cemil.baihongyu.com/