正则表达式和字符串处理.doc

正则表达式和字符串处理.doc

ID:50841882

大小:109.50 KB

页数:12页

时间:2020-03-15

正则表达式和字符串处理.doc_第1页
正则表达式和字符串处理.doc_第2页
正则表达式和字符串处理.doc_第3页
正则表达式和字符串处理.doc_第4页
正则表达式和字符串处理.doc_第5页
资源描述:

《正则表达式和字符串处理.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第一章        正则表达式概述正则表达式(RegularExpression)起源于人类神经系统的研究。正则表达式的定义有以下几种:l         用某种模式去匹配一类字符串的公式,它主要是用来描述字符串匹配的工具。l         描述了一种字符串匹配的模式。可以用来检查字符串是否含有某种子串、将匹配的子串做替换或者从中取出符合某个条件的子串等。l         由普通字符(a-z)以及特殊字符(元字符)组成的文字模式,正则表达式作为一个模版,将某个字符模式与所搜索的字符串进行匹配。l         用于描述某些规则的的工具。这些规则经常用于处理字符串中的

2、查找或替换字符串。也就是说正则表达式就是记录文本规则的代码。l         用一个字符串来描述一个特征,然后去验证另一个字符串是否符合这个特征。以上这些定义其实也就是正则表达式的作用。第二章 正则表达式基础理论这些理论将为编写正则表达式提供法则和规范,正则表达式主要包括以下基础理论:l         元字符l         字符串l         字符转义l         反义l         限定符l         替换l         分组l         反向引用l         零宽度断言l         匹配选项l         注释l 

3、        优先级顺序l         递归匹配2.1 元字符在正则表达式中,元字符(Metacharacter)是一类非常特殊的字符,它能够匹配一个位置或字符集合中的一个字符,如:、 w等。根据功能,元字符可以分为两种类型:匹配位置的元字符和匹配字符的元字符。2.1.1 匹配位置的元字符包括:^、$、和b。其中^(脱字符号)和$(美元符号)都匹配一个位置,分别匹配行的开始和结尾。比如,^string匹配以string开头的行,string$匹配以string结尾的行。^string$匹配以string开始和结尾的行。单个$匹配一个空行。单个^匹配任意行。b匹配

4、单词的开始和结尾,如:bstr匹配以str开始的单词,但b不匹配空格、标点符号或换行符号,所以,bstr可以匹配string、stringfomat等单词。bstr正则表达式匹配的字符串必须以str开头,并且str以前是单词的分界处,但此正则表达式不能限定str之后的字符串形式。以下正则表达式匹配以ing结尾的字符串,如string、Thisisastring等Ingb正则表达式ingb匹配的字符串必须以ing结尾,并且ing后是分界符,以下正则表达式匹配一个完整的单词:bstringb。2.1.2 匹配字符的元字符匹配字符的元字符有7个:.(点号)、w、

5、W、、s、S、d和D。其中点号匹配除换行之外的任意字符;w匹配单词字符(包括字母、汉字、下划线和数字);W匹配任意非单词字符、s匹配任意的空白字符,如空格、制表符、换行等;S匹配任意的非空白字符;d匹配任意数字字符;D匹配任意的非数字字符。如:^.$匹配一个非空行,在该行中可以包含除了换行符以外的任意字符。 ^w$匹配一个非空行,并且该行中只能包含字母、数字、下划线和汉字中的任意字符。 bawwwwww\b匹配以字母a开头长度等于7的任意单词 bawwwdddDb匹配以字母a开头后面有3个字符三个数字和1个非数字字符

6、长度等于8的单词 2.2 字符类字符类是一个字符集合,如果该字符集合中的任何一个字符被匹配,则它会找到该匹配项。字符类可以在[](方括号)中定义。如:[012345]可以匹配数字0到5中的任意一个。可以匹配HTML标签中的H1到H6。[Jj]ack可以匹配字符串Jack或jack。但是,由于表达式[0123456789]书写非常不方便,连字符(-)便应用而生,[0-9]等价于[0123456789]。[a-z]匹配任何小写字母,[A-Z]匹配任意大写字母。如果要在字符类中包含连字符,则必须包含在第一位,如:[-a]表示表达式匹配-或者a。在字符类中如果

7、^是字符类的第一个字符表示否定该字符串,也就是匹配该字符串外的任意字符,如:[^abc]匹配除了abc以外的任意字符,[^-]匹配除了连字符以外的任意字符,a[^b]匹配a之后不是b的字符串。表2-1 常用的字符类字符或表达式说明w匹配单词字符(包括字母、数字、下划线和汉字)W匹配任意的非单词字符(包括字母、数字、下划线和汉字)s匹配任意的空白字符,如空格、制表符、换行符、中文全角空格等S匹配任意的非空白字符d匹配任意数字D匹配任意的非数字字符[abc]匹配字符集中的任何字符[^abc]匹配除了字符集中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。