1、键入文字键入文字perl 语言正则表达式简介正则表达式(Regular Expression)是指定模式的一种方法,这种模式对文本进行筛选,只匹配特定的字符串。一旦匹配到了一个字符串,就可以从大量的文本中将其抽取出来,或者利用另一个字符串来替代这个字符串。其使用的格式为/pattern/,使用的匹配操作符为: =(匹配),!(不匹配)。Perl 语言中因为有这个功能,所以对于字符串的处理能力是非常强有力的。一:常用正则表达式简介:1匹配模式和匹配操作符:正如上面所说,匹配模式为/patter/,匹配操作符: =(匹配),!(不匹配) 。 例如: if($line = /round-trip/)
2、 2. 模式中的特殊字符:,* ,?, ,, m等字符的含义如下:/pattern/ 含义:x? 找寻 0 个或是 1 个 x 字符x* 找寻 0 个或是 0 个以上的 x 字符x+ 找寻 0 个或是 1 个以上的 x 字符m 找寻刚好是 m 个个数指定的字符m,n 找寻在 m 个数个数以上,n 个个数以下指定的字符 找寻符合内的字符 找寻不符合内的字符0-9 找寻符合 0 到 9 的任何一个字符a-z 找寻符合 a 到 z 的任何一个字符0-9 找寻不符合 0 到 9 的任何一个字符a-z 找寻不符合 a 到 z 的任何一个字符x 找寻字符 x 开头的字符$x 找寻字符 x 结尾的字符a|b
3、|c 找到符合 a 字符或是 b 字符或是 c 字符的字符串abc 找到一个含有 abc 的字符串d 找寻一个 digit(数字)的字符,和0-9语法一样D 找寻一个 non-digit(非数字)的字符,和0-9语法一样w 找寻一个英文字母或是数字的字符,和a-zA-Z0-9语法一样 W 找寻一个非英文字母,数字的字符,和a-zA-Z0-9语法一样s 找寻一个空白的字符S 找寻一个非空白的字符特别的是字符“.“,它可以匹配除换行外的所有字符,通常与*合用。 “.*”表示除换行外得任意个任意字符键入文字键入文字下面是一些正则表达式在实际中用到或常用的范例:范例: 说明:/pe*rl/ 找到 p
4、后面跟着 0 个或多个 e,再跟着 rl 的字符串,如同/cg0,1i/pe+rl/ 找到 p 后面跟着一个以上 e,再跟着 rl 的字符串,如同/cg1,i/pe?rl/ 找到 p 后面跟着 0 个或是一个 e,再跟着 rl 的字符串,如同/cg0,1i/p.rl/ 找到 p 后面跟着一个任意字符,再跟着 rl 的字符串/p.*rl/ 找到 p 后面跟着任意个任意字符,再跟着 rl 的字符串/p|r|l/ 找到含有 p 或 r 或 l 的字符串/pe2,4rl/ 找到 p 后面跟着 2 个到 4 个 e,再跟着 rl 的字符串 /perl/ 找到符合有这四个字符任意一个的字符串/perl/
5、找到没有这四个字符中任意一个的字符串/round-trip/ 找到含有 round-trip 的字符串/round-trip/ 找到开头是 round-trip 的字符串/round-trip$/ 找到结尾是 round-trip 的字符串/*/ 找到以*开头的字符串/ up| down/ 找到以空格 up 或空格 down 开头的字符串/CPU utilization for five seconds.*/ 找到含有“ CPU utilization for five seconds 加除换行符外的任意字符“的字符串/round-trip min/avg/max/ 找到含有“round-tr
6、ip min/avg/max”的字符串/-.*-/ 找到符合含有在以 “-”开头,且在“-“间“-“有除换行符外任何字符的字符串/d% packet loss/ 找寻符合含有“数字 packet loss“的字符串/ +d+/ 找到以一个或多个空格开头并且后接一个或多个数字的字符串/pamvr.*/ 找到以 pamvr 开头且后接除换行符外任意字符的字符串/up.*up/ 找到含有两个 up 且在它们间有除换行符外任意字符的字符串/-rw-rw-r-/ 找到以-rw-rw-r-开头的字符串/d$/ 找到以数字结尾的字符串/up$/i 找到以 up 结尾,并且忽略 up 大小写的字符串/d/ 找
7、寻符合数字的字符串,可以使用/d+/来表示一个或是多个数值的字符串/D/ 找寻符合不是数字的字符串/w/ 找寻符合英文字母,数字的字符串/W/ 找寻符合非英文字母,数字字符的字符 if ($line = /d+(.d+)?$/) 匹配非负浮点数例 1:检验变量名的类型:if ($varname = /$A-Za-z_0-9a-zA-Z*$/) #以字符$开头的变量print (“$varname is a legal scalar variablen“);#则为简单变量 elsif ($varname = /A-Za-z_0-9a-zA-Z*$/) #以字符开头的变量print (“$varn
8、ame is a legal array variablen“);#则为数组类型变量键入文字键入文字 elsif ($varname = /%A-Za-z_0-9a-zA-Z*$/) #以字符%开头的变量print (“$varname is a legal hash variablen“);#则为哈西表类型变量 else print (“I dont understand what $varname is.n“);#3. 转义字符:如果你想在模式中包含通常被看作特殊意义的字符,须在其前加斜线“。如:/*+/中*即表示字符*,而不是上面提到的一个或多个字符的含义。4. 模式匹配选项:a、匹配所
9、有可能的模式(g 选项),不加 g 只匹配一处。matches = “balata“ = /.a/g; # now matches = (“ba“, “la“, “ta“)b、忽略大小写(i 选项)例/de/i 匹配 de,dE,De 和 DE。c、将字符串看作多行(m 选项)在此情况下,符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾。d、将字符串看作单行例如/a.*bc/s 匹配字符串 axxxxxnxxxxbc,但/a.*bc/则不匹配该字符串。e、在模式中忽略空格/d2 (W) d2 1 d2/x 等价于/d2(W)d21d2/。5、替换操作符:语法为 s/pattern/
10、replacement/,其效果为将字符串中与 pattern 匹配的部分换成replacement。如:$string = “abc123def“;$string = s/123/456/; # now $string = “abc456def“;但在替换部分不支持模式的特殊字符,如,*,+等,如 s/abc/def/将把 abc 替换为def。6、翻译操作符:这是另一种替换方式,语法如:tr/string1/string2/。同样,string2 为替换部分,但其效果是把 string1 中的第一个字符替换为 string2 中的第一个字符,把 string1 中的第二个字符替换为 str
11、ing2 中的第二个字符,依此类推。如:$string = “abcdefghicba“;$string = tr/abc/def/; # now string = “defdefghifed“当 string1 比 string2 长时,其多余字符替换为 string2 的最后一个字符;当 string1 中同一个字符出现多次时,将使用第一个替换字符。键入文字键入文字二:其它正则表达式功能简介:这里要介绍的是其它一些较少用到的正则表达式功能,作为上面功能的补充。1、模式的部分重用当模式中匹配相同的部分出现多次时,可用括号括起来,用n(1,2)来多次引用,以简化表达式:例如:/d2(W)d21
12、d2/ 匹配:12-05-9226.11.8707 04 92 等但不匹配 12-05.92注意:/d2(W)d21d2/ 不同于/(d2)(W)121/ ,后者只匹配形如 17-17-17 的字符串,而不匹配 17-05-91 等。2、指定模式定界符缺省的,模式定界符为反斜线/,但其可用字母 m 自行指定,如:m!/u/jqpublic/perl/prog1! 等价于/u/jqpublic/perl/prog1/注:当用字母作为定界符时,不做变量替换;当用特殊字符作为定界符时,其转义功能或特殊功能即不能使用。成对的符号必须成对地使用。3、模式次序变量在模式匹配后调用重用部分的结果可用变量$n
13、,全部的结果用变量$string = /-?(d+).?(d+)/; # 匹配结果为 25.11$integerpart = $1; # now $integerpart = 25$decimalpart = $2; # now $decimalpart = 11$totalpart = $&; # now totalpart = 25.114扩展模式匹配PERL 支持 PERL4 和标准 UNIX 模式匹配操作所没有的一些模式匹配能力。其语法为:(?pattern),其中 c 是一个字符,pattern 是起作用的模式或子模式。a、不存贮括号内的匹配内容在 PERL 的模式中,括号内的子模式
14、将存贮在内存中,此功能即取消存贮该括号内的匹配内容,如/(?:a|b|c)(d|e)f1/中的1 表示已匹配的 d 或 e,而不是 a 或 b 或 c。b、内嵌模式选项通常模式选项置于其后,有四个选项:i、m、s、x 可以内嵌使用,语法为:/(?option)pattern/,等价于/pattern/option。c、肯定的和否定的预见匹配肯定的预见匹配语法为/pattern(?=string)/,其意义为匹配后面为 string 的模式,相反的,(?!string)意义为匹配后面非 string 的模式,如:$string = “25abc8“;$string = /abc(?=0-9)/;
15、键入文字键入文字$matched = $&; # $解说: 返回子串 substring 在字符串 string 中的位置,如果不存在则返回-1。参数 position是可选项,表示匹配之前跳过的字符数,或者说从该位置开始匹配。举例: my $lPosition=index($line,/);#第一个字符“/”在字符串$line 中的位置,参数 position 忽略函数名称: rindex调用语法: position = rindex (string, substring, position);解说: 与 index 类似,区别是从右端匹配。举例: my $rPosition=rindex(
16、substr($line,0,$rPosition-1),/);#右边第一个字符“/”在字符串$line 中的位置,参数 position 忽略函数名称: substr调用语法: substr (expr, skipchars, length)解说: 抽取字符串 expr 中的子串,跳过 skipchars 个字符,或者说从位置 skipchars 开始抽取子串(第一个字符位置为 0) ,子串长度为 length,此参数可忽略,意味着取剩下的全部字符。举例: my $procCpu=substr($line,$lPosition+1,$rPosition-$lPosition-1);函数名称:
17、 length调用语法: num = length (string);解说: 返回字符串长度,或者说含有字符的数目。举例: my $num = length($oldSubStr)函数名称: split调用语法: list = split (pattern, string, maxlength);解说: 将字符串分割成一组元素的列表。每匹配一次 pattern,就开始一个新元素,但pattern 本身不包含在元素中。maxlength 是可选项,当指定它时,达到该长度就不再分割。举例: list=split(/ +/,$line): 将字符串$line 以一个或多个空格为分隔符,分割成一个数组
18、list键入文字键入文字函数名称: join调用语法: join(joinstr,list);解说: 把字符串列表(数组)组合成一个长的字符串,在每两个列表元素间插入串 joinstr。举例: $string = join(“n“,resultString):将数组resultString 以换行符为标志合并成一个字符串$string函数名称: push调用语法: push(arrayvar,elements);解说: 在数组末尾增加一个或多个元素举例: push(outputArgv,“丢包率=int,%,丢包率n“);函数名称: grep调用语法: list = grep(pattern,searchlist);解说: 在数组searchlist 中抽取与指定模式匹配的元素,参数 pattern 为欲查找的模式,返回值是匹配元素的列表(数组)举例: my temp=grep(/d/,transferResult);
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。