正则表达式提取网页内容

铁塔埃菲尔 2009-11-30 11:00:35
如何提取用正则表达式提取 蜡笔小新 四个字啊 ??
<TD class=tableGhf width=370 colSpan=3 widtd="50%">蜡笔小新</TD>
...全文
169 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
零度空间0520 2010-07-14
  • 打赏
  • 举报
回复
我想问下widtd="50%"是什么意思的
hzvcan 2009-11-30
  • 打赏
  • 举报
回复
北京
jiangshun 2009-11-30
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 wxluck 的回复:]
再麻烦您一下 我要是只提取带 这个 <TD class=tableGhf标记 内容怎么写正则表达式啊??引用 4 楼 jiangshun 的回复:
C# codestring html=@" <TD class=tableGhf width=370 colSpan=3 widtd=""50%"">张三 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">登证证书编号 </TD>
<TD class=tableGhf width=101 widtd=""17%"">未填写 </TD> </TR>
<TD c?-

[/Quote]


能不能一次说完啊?

........


            string html = @"<TD class=tableGhf width=370 colSpan=3 widtd=""50%"">张三 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">登证证书编号 </TD>
<TD class=tableGhf width=101 widtd=""17%"">未填写 </TD> </TR>
<TD class=tdbg1 width=102 widtd=""13%"">住址 </TD>
<TD class=tableGhf width=370 colSpan=3 height=20 widtd=""50%"">北京 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">状态 </TD>
<TD class=tableGhf width=101 height=20 widtd=""17%"">违法未处理 </TD> ";
Regex reg = new Regex(@"(?is)<TD\sclass=tableGhf.*?>([^<]+)</TD>");
MatchCollection mc = reg.Matches(html);
Console.WriteLine("/*\n------输出结果------------");
foreach (Match m in mc)
{
Console.WriteLine( m.Groups[1].ToString());
}

Console.WriteLine("*/");

/*
------输出结果------------
张三
未填写
北京
违法未处理
*/
铁塔埃菲尔 2009-11-30
  • 打赏
  • 举报
回复
再麻烦您一下 我要是只提取带 这个 <TD class=tableGhf 标记 内容怎么写正则表达式啊??[Quote=引用 4 楼 jiangshun 的回复:]
C# codestring html=@"<TD class=tableGhf width=370 colSpan=3 widtd=""50%"">张三 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">登证证书编号 </TD>
<TD class=tableGhf width=101 widtd=""17%"">未填写 </TD> </TR>
<TD c?-
[/Quote]
jiangshun 2009-11-30
  • 打赏
  • 举报
回复
            string html = @"<TD class=tableGhf width=370 colSpan=3 widtd=""50%"">张三 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">登证证书编号 </TD>
<TD class=tableGhf width=101 widtd=""17%"">未填写 </TD> </TR>
<TD class=tdbg1 width=102 widtd=""13%"">住址 </TD>
<TD class=tableGhf width=370 colSpan=3 height=20 widtd=""50%"">北京 </TD>
<TD class=tdbg1 width=113 widtd=""17%"">状态 </TD>
<TD class=tableGhf width=101 height=20 widtd=""17%"">违法未处理 </TD> ";
Regex reg = new Regex(@"(?is)(?<=>)[^<]+(?=<)");
MatchCollection mc = reg.Matches(html);
Console.WriteLine("/*\n------输出结果------------");
foreach (Match m in mc)
{
Console.WriteLine( m.Groups[0].ToString());
}

Console.WriteLine("*/");

/*
------输出结果------------
张三


登证证书编号


未填写



住址


北京


状态


违法未处理
*/

铁塔埃菲尔 2009-11-30
  • 打赏
  • 举报
回复
<TD class=tableGhf width=370 colSpan=3 widtd="50%">张三 </TD>
<TD class=tdbg1 width=113 widtd="17%">登证证书编号 </TD>
<TD class=tableGhf width=101 widtd="17%">未填写 </TD> </TR>
<TD class=tdbg1 width=102 widtd="13%">住址 </TD>
<TD class=tableGhf width=370 colSpan=3 height=20 widtd="50%">北京 </TD>
<TD class=tdbg1 width=113 widtd="17%">状态 </TD>
<TD class=tableGhf width=101 height=20 widtd="17%">违法未处理 </TD>


怎么用正则表达式提取上面的 张三 登证证书编号 未填写 。。。。 等文字
[Quote=引用 2 楼 jiangshun 的回复:]
引用 1 楼 jiangshun 的回复:
C# code" <[^>]+>"


">[^ <]+ <"
[/Quote]
jiangshun 2009-11-30
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 jiangshun 的回复:]
C# code"<[^>]+>"
[/Quote]

">[^<]+<"
jiangshun 2009-11-30
  • 打赏
  • 举报
回复
"<[^>]+>"
flowerjack 2009-11-30
  • 打赏
  • 举报
回复
关注中
md198687 2009-11-30
  • 打赏
  • 举报
回复
<TD class=tableGhf width=370 colSpan=3 widtd="50%">(*.?) </TD>
内容概要:本文围绕“基于双层共识控制的直流微电网优化调度”展开研究,提出了一种结合双层控制架构与共识算法的优化调度方法,旨在提升直流微电网在分布式能源接入背景下的协调控制能力与运行效率。上层采用集中式优化策略进行全局经济调度,下层则通过分布式共识控制实现各分布式电源间的自主协同,有效解决了系统中功率平衡、电压稳定与资源优化配置等问题。文中详细构建了数学模型,并利用Matlab进行仿真验证,结果表明该方法在动态负载变化与新能源波动条件下仍具备良好的鲁棒性与收敛性,能够实现高效、可靠的微电网能量管理。; 适合人群:具备一定电力系统、自动化或控制理论基础,熟悉Matlab仿真工具,从事新能源、微电网、智能电网等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:① 掌握双层控制架构在微电网调度中的设计思路与实现方式;② 学习共识算法在分布式能源协调控制中的具体应用;③ 复现论文算法并拓展至多智能体协同、直流配电系统优化等研究方向; 阅读建议:此资源以论文复现为核心,建议读者结合Matlab代码深入理解算法实现细节,重点关注上下层控制器的信息交互机制与收敛条件设定,同时可尝试引入更多不确定性因素以增强模型实用性。

111,122

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Creator Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧