能否用正则表达式处理类似 A [B C]和 A B 以及 A C的匹配

zzyx 2003-03-18 10:28:54
有两个串,形式为 A [B C] 或者更多,[]代表其内部为或的关系

串一:zhang [peng ping]
串二:[zhao zhang][ping pang]
我想要实现的是对以上两个串,应该有串一的:zhang ping和串二的:zhang ping 匹配。

能否用正则表达式实现对以上串的匹配?怎么做?
或者有别的办法来处理?
哪位大侠出手吧?
...全文
85 9 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
shshsh_0510 2003-03-27
  • 打赏
  • 举报
回复
我没太懂你的问题,不过好像类似词法分析。
你说的“ABC1234x“的二意性当然会存在。著名的lex处理这种二义性的方法是以下两条优先原则:
1、匹配最长的串
2、匹配规则表中位置靠前的
不知对你是否有帮助。
zzyx 2003-03-22
  • 打赏
  • 举报
回复
啊普
zzyx 2003-03-19
  • 打赏
  • 举报
回复
更正:上边的
a [ b c d] e 得到的一个组合
a b e
a c e
b d e

改为
a [ b c d] e 得到的一个组合
a b e
a c e
a d e

zzyx 2003-03-19
  • 打赏
  • 举报
回复
非常感谢以上的朋友的帮助。

TO: plainsong(伤心的风)
我想,按照你的思路,
用表达式:"ABC(1234)|(123)(4x)|(5y)"去匹配"ABC1234x"
是可以实现的。

但麻烦的是 ABC1234x也可能是另外一个类似ABC(1234)|(123)(4x)|(5y)的串。

可能我的表达不清除,再举例子:
以下a b c d e x y 等都代表一个不包括空格的字符串,[]代表其中的串是或的关系

a [ b c d] e 得到的一个组合
a b e
a c e
b d e


另外一个串
a [b x] [e y]的可能性为
a b e
a b y
a x e
a x y

则以上的 a b e为匹配的。

另外,我在遇到这个问题的时候才刚接触正则表达式,术语,符号都不清楚呢,所以才提问能否使用。

我现在已经把这个问题先处理掉了,就是按照我上边的例子的思路,对每个串顺序遍历,使用2维数组,保存分解出的字符串,然后再比较数组,判断。只是觉得比较笨。

TO:tarkey(天星)
KMP查找算法按我的理解比较时候直接从固定的串中找特定的串
在我的问题中我想不到如何应用


短歌如风 2003-03-19
  • 打赏
  • 举报
回复
你用的正则表达式的语法好怪呀!一般都是这样表达的:
"zhang (peng)|(ping)"
而"zhang [peng ping]"通常都匹配"zhang p"、"zhang e"、"zhang "等。
匹配时不应直接使用表达式字串,要先对它进行分析。如果只是解决你这个问题的话比较简单,你可以写两个类,一个负责简单的匹配(目标字串的左子串与指定字串相比较),一个负责用一个字串列表去依次进行简单匹配直到成功或全部失败。
在用列表匹配时可能会有多个成功的结果,你要按一个顺序继续后续的匹配,如果整个表达式匹配成功则成功,否则再选择下一个。如:
用表达式:"ABC(1234)|(123)(4x)|(5y)"去匹配"ABC1234x":

1:"ABC" 匹配 "ABC"成功,剩余字串:"1234x";
2:"(1234)|(123)"匹配"1234"成功,剩余字串:"x";
3:"(4x)|(5y)"匹配失败。重新第二步匹配。
4:"(1234)|(123)"匹配"123"成功,剩余字串:"4x";
5:"(4x)|(5y)"匹配"4x"成功。

一般实用的正则表达式语法都很复杂,很难用简单的方法实现。建议使用“解释器”模式。
tarkey 2003-03-19
  • 打赏
  • 举报
回复
你去看看KMP算法吧。。
zzwu 2003-03-18
  • 打赏
  • 举报
回复
想法如下:
char a='A';
char b={'B','C','D'};
char c={'E','F'};
for (i=0; i<3; i++)
for (j=0; j<2; j++)
println(a+b[i]+c[j]);
zzyx 2003-03-18
  • 打赏
  • 举报
回复
或者有办法能实现把如 A [B C D][E F]
这样的表达式转为
A B E
A B F
A C E
A C F
A D E
A D F
也好,有思路有分
zzyx 2003-03-18
  • 打赏
  • 举报
回复
谢谢zzwu(未名) 。

我想你的思路基本可行,但具体实现上还有些困难。

首先,A B C等等都是代表一个长串中的子串,分解有些麻烦,存储也麻烦
其次,每个串的具体长度是不固定的,存储上需要考虑的东西比较多

我能想到最土的办法实现,但是想找找有没有比较精巧的方法。
访问真八字排盘系统介绍: 1、八字排盘 八字排盘是将年月日时按照天干地支的形式进行排列,一个时间单位代表了一个柱。八字由年柱、月柱、日柱和时柱共四个柱组成,也被称为四柱八字。八字学中基于中国阴阳五行、天干地支与刑冲克害、以及民间盲派的神煞论等方式,进一步预测爱情顺遂、工作高低、姻缘好坏、财富高低、学业成就、身体健康等事的学问。 八字排盘由以下元素组合:年月日时四柱、大运干支、胎元 、流年干支、十神、地势、神煞等。生辰八字不只是把干支历计算出来,而还要遵守月令、节令的强弱,时辰的阴阳变化进行校正。排盘分析,就是根据出生者的性别、天干地支的阴阳五行关系、进一步推算出来的一套方法论,给预测者做人生吉凶的参考数据,在未来事业、财运、婚姻、家庭等问题时,能做出风险较低的决策。 八字排盘怎么看 八字排盘由年、月、日、时四柱组成,每柱包含一个天干和一个地支,共八个字。年柱代表出生的年份,月柱代表出生的月份,日柱代表出生的日期,时柱则代表出生的时辰。每个柱的干支组合都会对个人的命运产生影响。天干地支旁边标注的正财、偏财、偏印、正印、比肩、劫财、食神、伤官、正官、七杀等,称为十神。 2、八字排盘软件介绍 我们是腾讯云市场金牌合作伙伴,广州正规软件开发公司,开发的八字排盘系统数据最全面精准,我们八字排盘采用最精确的排盘程序,而且运用“真太阳时”,进行更精确的时间划分。大家都知道我们使用的北京时间,是统一规定的标准时间。而八字排盘需要相对于太阳方位的天文时间,即平太阳时。我们国家地大物博,北京时间19时,哈尔滨已经夜幕降临,而新疆却还是太阳高挂,这时哈尔滨的天文时间可能在20:00以后,而新疆的天文时间可能在16时以前。北京时间是东经120度经线的平太阳时,如果您出生地的经度与北京时间所处的经度差异较大,或者处于单数时间点的前后,比如6点差一刻,8点,10点15分等

33,027

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧