真爱无限的知识驿站

学习积累技术经验,提升自身能力

[转载].net中的正则表达式使用高级技巧

一、前言

一、本系列文章不讲述基本的正则语法,这些可以在微软的JS帮助文档中找到,也可以Google一下
二、写系列文章的原因 
1、正则很有用,而且经常要用 
2、正则的一些高级用法有相当一部分人还没有理解和掌握 
3、刚好又在网上看到了一篇文章错误的使用了正则式,使我有了写本文的冲动 
4、本系列文章的大部分知识可同时适用于.net语言,JavaScript等
三、本系列文章特点:尽量使用小例子来说明相对难懂而很多正则书籍都没有说清的正则语法 
四、本系列文章内容:替换的高级语法,内联表达式选项,组,反向引用,正声明,负声明,正反声明,负反声明,非回溯匹配,判断式,.net正则引擎特点等
 

转载自:http://www.cnblogs.com/think/

http://www.cnblogs.com/thinhunan/archive/2006/02/28/RegexExpressionSyntax1.html

http://www.cnblogs.com/thinhunan/archive/2006/03/01/regexexpressionsyntax2.html

http://www.cnblogs.com/thinhunan/archive/2006/03/02/regexexpressionsyntax3.html

http://www.cnblogs.com/thinhunan/archive/2006/03/03/regexexpressionsyntax4.html

1、高级技巧1

替换

Regex类有一个静态的Replace方法,其实例也有一个Replace方法,这个方法很强大,因为它可以传入一个delegate,这样,你可以自定义每次捕获匹配时,如何处理捕获的内容。 

        public static void Main()
        
{    
            
string s = "1 12 3 5";
            s 
= Regex.Replace(s,@"d+",new MatchEvaluator(CorrectString),RegexOptions.Compiled|RegexOptions.IgnoreCase);
            Console.WriteLine(s);
            Console.ReadLine();
        }

        
private static string CorrectString(Match match)
        
{
            
string matchValue = match.Value;
            
if(matchValue.Length == 1)
                matchValue 
= "0" + matchValue;
            
return matchValue;
        }

以上这段代码说明了如果使用delegate MatchEvaluator来处理正则的Match结果,该代码返回"01 12 03 05"。Replace方法除了使用delegate来处理捕获的Match,还可以用字符串来替换Match的结果,而用字符串来替换Match结果除了把Match结果静态的替换成一个固定的文本外,还可以使用以下语法来更方便的实现你需要的功能:


$number

把匹配的第number组替换成替换表达式,还有这句话怎么写也表达不清楚意思,还是来个例子吧:


        public static void Main()
        
{    
            
string s = "1 12 3 5";
            s 
= Regex.Replace(s,@"(d+)(?#这个是注释)","0$1",RegexOptions.Compiled|RegexOptions.IgnoreCase);
            Console.WriteLine(s);
            Console.ReadLine();
        }

这段代码返回的是 “01 012 03 05”

就是说,对组一的每个匹配结果都用"0$1"这个表达式来替换,"0$1"中"$1"由组1匹配的结果代入

${name}

把匹配的组名为"name"的组替换成表达式,

上例的Regex expression改成@"(?<name>d+)(?#这个是注释)"后面的替换式改为"0${name}"结果是一样的

$$  

做$的转义符,如上例表达式改成@"(?<name>d+)(?#这个是注释)"和"$$${name}",则结果为"$1 $12 $3 $5"

$&

替换整个匹配

$`

替换匹配前的字符

$'

替换匹配后的字符

$+

替换最后匹配的组

$_

替换整个字符串

后面的选项,大家自己写个例子体味一下。

*注,上例中的(?#这个是注释)说明了正则的内联注释语法为(?#)



表达项选项

正则表达式选项RegexOptions有如下一下选项,详细说明请参考联机帮助


RegexOptions枚举值

内联标志

简单说明

ExplicitCapture

n

只有定义了命名或编号的组才捕获

IgnoreCase

i

不区分大小写

IgnorePatternWhitespace

x

消除模式中的非转义空白并启用由 # 标记的注释。

MultiLine

m

多行模式,其原理是修改了^和$的含义

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.7.3

Copyright 2024-2027 pukuimin Rights Reserved.
粤ICP备17100155号