回来了,散分:顺便说说正则的几个基本概念,请笑纳,呵呵

qiushuiwuhen 2003-02-08 10:05:25
经常看到说正则的文章,但说的只是方法,却很少有说以下几个基本概念:

1.贪婪:+,*,?,{m,n}等默认是贪婪匹配,即尽可能多匹配,也叫最大匹配
如果后面加上?,就转化为非贪婪匹配,需要高版本支持,而.net默认支持

2.获取:默认用(x|y)是获取匹配,很多时候只是测试,不一定要求得到所匹配的数据,
尤其在嵌套匹配或大数据中就要用非获取匹配(?:x|y),这样提高了效率,优化了程序。

3.消耗:默认是消耗匹配,一般在预查中是非消耗匹配。
举个例子,2003-2-8要变为2003-02-08
如果用/-(\d)-/第二次匹配将从8开始,从而只替换第一个2,错误
如果用/-(\d)(?=-)/则第二次匹配从第二个-开始,即不消耗字符-

4.预查:有两种,一种是前预查和后预查,个中又要分为正向预查和负向预查
如上面的(?=pattern)是正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。
还有(?!pattern)是负向预查,在任何不匹配 pattern 的字符串开始处匹配查找字符串。
在严格的正则中一般用在一个匹配的后面,如果要在前面加预查匹配,就要用(?<=pattern)等

5.回调:一般用在替换上,即根据不用的匹配内容返回不用的替换值,从而简化了程序。
需要高版本支持,.net中用MatchEvaluator,参见 http://www.csdn.net/develop/read_article.asp?id=16002

6.引用:\num 对所获取的第num个匹配的引用。
例如,'(.)\1\1' 匹配AAA型。'(.)(.)\2\1' 匹配ABBA型。


当然还有很多,如根据条件匹配(?(条件)匹配1:匹配2) 等

遇到正则问题,一般可用以下两种方法解决:

1.分类,即根据所有的可能列出各种情况,如2003以内的数
0 0
1-999 [1-9]\d{0,2}
1000-1999 1\d{3}
2000-2003 200[0-3]

所以最后的匹配就是 (0|[1-9]\d{0,2}|1\d{3}|200[0-3])
http://www.csdn.net/develop/read_article.asp?id=16011

2.分组,即将整句分为不同的最小单元,如'、%、_成双出现
能成组的,即允许存在的,有
''
%% 如果是大于2的偶数个可细分为多个更小的2字符单元
__
[^'%_] 非以上字符

所以最后的匹配就是 ^(''|%%|__|[^'%_])*$
http://expert.csdn.net/Expert/TopicView1.asp?id=1407197

就所学的知识总结一下,抛砖引玉,请笑纳,呵呵
...全文
103 55 打赏 收藏 转发到动态 举报
写回复
用AI写文章
55 条回复
切换为时间正序
请发表友善的回复…
发表回复
hanfey 2003-08-18
  • 打赏
  • 举报
回复
learning......
glboy 2003-03-14
  • 打赏
  • 举报
回复
mark
大健 2003-02-10
  • 打赏
  • 举报
回复
学习。。。
imports 2003-02-10
  • 打赏
  • 举报
回复
谢谢!
houjianxun 2003-02-10
  • 打赏
  • 举报
回复
谢谢楼主了
luckysusan 2003-02-10
  • 打赏
  • 举报
回复
up
WQLu 2003-02-10
  • 打赏
  • 举报
回复
先收了
Jain123 2003-02-10
  • 打赏
  • 举报
回复
先收藏
学习
weizhiyong 2003-02-10
  • 打赏
  • 举报
回复
up
悟空师傅来了 2003-02-10
  • 打赏
  • 举报
回复
谢谢楼主!!
qiushuiwuhen 2003-02-10
  • 打赏
  • 举报
回复
csdn里就有中文帐号的是因为有一段时间允许

即使是处理不好,也和用不用正则无关。

一般是bs两方面都验证为好
Inyoureyes 2003-02-09
  • 打赏
  • 举报
回复
多谢,收藏了
用户 昵称 2003-02-09
  • 打赏
  • 举报
回复
study
minajo21 2003-02-09
  • 打赏
  • 举报
回复
up
StevenWSF 2003-02-09
  • 打赏
  • 举报
回复
GOOD
yellowwee 2003-02-09
  • 打赏
  • 举报
回复
good!
Davelu 2003-02-09
  • 打赏
  • 举报
回复
THX
zxhong 2003-02-09
  • 打赏
  • 举报
回复
你看csdn里就有中文帐号的

是不是用正则,而又没有处理好。。。。
qiushuiwuhen 2003-02-09
  • 打赏
  • 举报
回复
to zxhong(红透半边天)
正则校验起的是简化,跟在什么地方用没多关系
如果不用就更麻烦了,因为同样需要分情况判断
当然它也不是万能的,有时候也需要字符串操作
正则也有良莠繁简分,但能校验正确就已经够了

flyfish51f 2003-02-09
  • 打赏
  • 举报
回复
笑纳
加载更多回复(35)

62,041

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧