正则表达式的重复捕获问题

idiszerg 2009-07-05 05:25:47

要对下面的字符串操作
a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4

只是举了个例子，并不是IP因此后面的字符有可能有多个比如999.12.1.2.3

问题是怎么提取出如下形式
a
127
0
0
1
b2
128
0
0
1
后面依次类推

当然有种方法是先将字符串分开成
a:127.0.0.1
b2:128.0.0.1;
c1:129.0.0.1;
d21:999.12.1.2.33.4
然后再依次进行提取，有没有办法用一个正则表达式就搞定
这是我写的
([a-z].*?):((\d*)\.?)+;?

但是这能捕获到前面的字母，后面的数字提取不到

...全文

279 32 打赏收藏转发到动态举报

写回复

用AI写文章

32 条回复

切换为时间正序

请发表友善的回复…

发表回复

十八道胡同 2009-07-05

打赏
举报

Regex re = new Regex(@"([a-z0-9]+:((?<ww>\d+)[\.;]?)+)+");

            string s = "a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4";

            Console.WriteLine(re.Match(s).Value);

            Console.WriteLine( re.Match(s).Groups["ww"].Value);

ww里面一直是最后一个数字（这里是4），好像没有把以前的记录存下来。。

十八道胡同 2009-07-05

打赏
举报

[Quote=引用 30 楼 idiszerg 的回复:]
(? <name>exp)

匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)

这种也是可以的
[/Quote]

这句话是对的，我以明白了你的意思，正在找答案中

idiszerg 2009-07-05

打赏
举报

(?<name>exp)

匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)

这种也是可以的

idiszerg 2009-07-05

打赏
举报

多谢2位了，我做了下试验觉得重复里面的捕获是不可以的

比如对于12345.2222.111123.12345
使用正则表达式捕获
(\d)+
结果只能找到5，2，3，5即重复部分的最后一个

结贴了，多谢

十八道胡同 2009-07-05

打赏
举报

(?<name> )

将匹配的子字符串捕获到一个组名称或编号名称中。用于 name 的字符串不能包含任何标点符号，并且不能以数字开头。可以使用单引号替代尖括号，例如 (?'name')。

windinwing 2009-07-05

打赏
举报

Regex r = new Regex(@"(\w+:)(.*?)(;|$)", RegexOptions.IgnoreCase);
Match m = r.Match("a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4");
if (m.Success)
{
string prefix = m.Result("$1");
string[] ips= m.Result("$2").Split(".");
}

没做测试,理论上行,一个取前缀,一个取分组.

windinwing 2009-07-05

打赏
举报

Regex r = new Regex(@"(?:\w+:).*?(;|$)", RegexOptions.IgnoreCase);
Match m = r.Match("a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4");
if (m.Success)
{
string[] ips= m.Result("$1").Split(".");
}

这里就是数字分组了

idiszerg 2009-07-05

打赏
举报

获得数据为：0#=127 1#=0 2#=0 3#=1

获得数据为：0#=128 1#=0 2#=0 3#=1

获得数据为：0#=129 1#=0 2#=0 3#=1

获得数据为：0#=999 1#=12 2#=1 3#=2 4#=33 5#=4

能不能用一句正则表达式实现

windinwing 2009-07-05

打赏
举报

[(? <111>\d+)\.]+ 这个没错但是像d21:xxxx这里可以匹配d21里的21.

idiszerg 2009-07-05

打赏
举报

我的目的在14楼

原来写的分两步
1、提取出
127.0.0.1
128.0.0.1
999.1.2.3.4等
然后用split分开，获得所有数字

“按 :分组,在接.号分组? 可以用Result(string)方法,用$访问分组在分组. ”
没大看明白

十八道胡同 2009-07-05

打赏
举报

你的意思是想.前面的数字放111里面？

windinwing 2009-07-05

打赏
举报

[(?<111>\d+)\.]+ 这个没错

windinwing 2009-07-05

打赏
举报

google... 我们都没弄明白你想表达什么.

a:127.0.0.1
按 :分组,在接.号分组? 可以用Result(string)方法,用$访问分组在分组.

idiszerg 2009-07-05

打赏
举报

[(? <111>\d+)\.]+
这里面？<111>表示捕获\d+
\.表示“.”

我感觉应该没错啊，请问我应该怎么改下

windinwing 2009-07-05

打赏
举报

([a-z0-9]+)+:([(?<111>\d+)\.]+)

为啥group “111”没有捕获出来。。。
[(?<111>\d+)\.] 你这个在[]分组里,表示为? ,1数字,\.字类的字符之一,然后重复N次当然没结果

idiszerg 2009-07-05

打赏
举报

呵呵，多谢你了，忙活了一晚上

c#用的不熟，项目要求的没办法

另外如果google这个问题的话关键字应该是啥？

正则表达式重复部分的捕获或者在重复部分捕获？

都找不到相关的

十八道胡同 2009-07-05

打赏
举报

呵呵，答来答去我还是没开清您的要求，见笑了。。
提一个小改进



ma.Groups[2].Value.Split(delimiter);

为



ma.Groups[2].Value.Split(new char[]{'.'});

作用是一样的，

idiszerg 2009-07-05

打赏
举报

([a-z0-9]+)+:([(?<111>\d+)\.]+)

为啥group “111”没有捕获出来。。。

idiszerg 2009-07-05

打赏
举报

            string s = "a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4";



            Regex re = new Regex(@"([a-z0-9]+)+:([\d+\.]+)", RegexOptions.None);



            MatchCollection mc = re.Matches(s);

            string delimStr = ".";

            char[] delimiter = delimStr.ToCharArray();

            string[] ret;

            foreach (Match ma in mc)

            {

                ret = ma.Groups[2].Value.Split(delimiter);

                Console.Write("获得数据为：");

                for(int i=0;i<ret.Count();i++)

                    Console.Write(i+"#="+ret[i] +" ");

                Console.WriteLine("\r\n");

            }

结果：
获得数据为：0#=127 1#=0 2#=0 3#=1

获得数据为：0#=128 1#=0 2#=0 3#=1

获得数据为：0#=129 1#=0 2#=0 3#=1

获得数据为：0#=999 1#=12 2#=1 3#=2 4#=33 5#=4

我要的是这些数据

十八道胡同 2009-07-05

打赏
举报

[Quote=引用 11 楼 idiszerg 的回复:]

我的问题是重复定义里面的捕获为什么只捕获了最后一个
([a-z].*?):((\d*)\.?)+;?
这里面的((\d*)\.?)+捕获部分(\d*)其实是捕获了最后一个数字的
比如127.0.0.1他只捕获到1的
[/Quote]
你看下面

 Regex re = new Regex(@"([a-z].*?):((\d*)\.?)+;?");

answer:a:127.0.0.1;
请按任意键继续. . .

 Regex re = new Regex(@"(([a-z].*?):((\d*)\.?)+;?)+");

answer:a:127.0.0.1;b2:128.0.0.1;c1:129.0.0.1;d21:999.12.1.2.33.4
请按任意键继续. . .

((\d*)\.?)+;?书捕获了所有的数字. 的组

目录 [隐藏] 1 简介 2 简单模式 2.1 字符匹配 2.2 重复 3 使用正则表达式 3.1 编译正则表达式 3.2 反斜杠的麻烦 3.3 执行匹配 3.4 模块级函数 3.5 编译标志 4 更多模式功能 4.1 更多的元字符 4.2 分组 4.3 无捕获组和命名组 4.4 前向界定符 5 修改字符串 5.1 将字符串分片 5.2 搜索和替换 6 常见问题 6.1 使用字符串方式 6.2 match() vs search() 6.3 贪婪 vs 不贪婪 6.4 不用 re.VERBOSE 7 反馈 8 大标题文字 9 关于本文档 10 of LaTeX2HTML to the Python documentation

前面我们知道正则表达式有很多元字符表示匹配次数（量词），都是可以重复匹配前面出现的单个字符次数。有时候，我们可能需要匹配一组多个字符一起出现的次数。这个时候，我们需要分组了。就是用小括号来括起这些字符，指定子表达式(也叫做分组)。然后你就可以指定这个子表达式的重复次数了，你也可以对子表达式进行其它一些操作。这个时候，可以把括号中一组字符，看作一个整体了。分组模式举例说明如：查找字符串中，连续出现多个win字符串的字符。可以这样完 <?php $str = "this is win winwindows!"; preg_match_all("/(win)+/",$str,$marr); v

pasteAnalyzer 在Google自定义引擎中搜索文本中的关键字，然后对其进行分析以使其与正则表达式匹配。在用于分析OSINT的渗透测试的“信息收集”阶段可用。获得“原始”内容进行处理的站点：github.com，gist.github.com，pastebin.com，pastee.org和pastie.org。支持所有站点，但是会完全搜索HTML以查找与正则表达式匹配的内容。 #Dependencies（Python 2.7）google-api-python-client（）＃指示您需要一个Google帐户，才能使用Google自定义搜索引擎（引擎ID）和Google自定义API（API密钥）。遵循教程... ./regex是正则表达式文件的示例，格式为以＃开头的第一行类别，第二行是正则表达式...并重复...并重复。 正则表达式仅允许捕获一组

110,534

社区成员

642,575

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章