关于正则提取网址的问题,在线等~十万火急

怎么来这一出 2012-10-08 11:55:53
获取一个html源码,然后提取里面的符合条件的网址,比如http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml这种,结尾是若干数字+“.shtml”结尾的网址,怎么用正则表达式做到呢?
...全文
188 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
怎么来这一出 2012-10-08
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 lzxue1989 的回复:]

C# code

string s = ",比如http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml 这种";
s = Regex.Match(s, @"[a-zA-z]+://[^\s]*").ToString();
System.Diagnostics.Debug.Pri……
[/Quote]不对啦,有很多网址:http://style.t.sina.com.cn/index.shtml http://roll.style.sina.com.cn/fas/jewelry/index.shtml http://roll.style.sina.com.cn/time/guide/index.shtml http://roll.style.sina.com.cn/tas/cigar/index.shtml http://roll.style.sina.com.cn/tas/club/index.shtml http://roll.style.sina.com.cn/lei/hotels/index.shtml http://roll.style.sina.com.cn/lei/cars/index.shtml http://roll.style.sina.com.cn/lei/yachting/index.shtml http://roll.style.sina.com.cn/des/architecture/index.shtml http://roll.style.sina.com.cn/industry/index.shtml http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml我只需要数字+“.shtml”结尾的
csdn_风中雪狼 2012-10-08
  • 打赏
  • 举报
回复

string s = ",比如http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml 这种";
s = Regex.Match(s, @"[a-zA-z]+://[^\s]*").ToString();
System.Diagnostics.Debug.Print(s);
MessageBox.Show(s);
// 输出
// http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml

不好意思,一楼的没有测试,这用这个
csdn_风中雪狼 2012-10-08
  • 打赏
  • 举报
回复
([/w-]+/.)+[/w-]+.([^a-z])(/[/w- ./?%&=]*)?|[a-zA-Z0-9/-/.][/w-]+.([^a-z])(/[/w- ./?%&=]*)?

([/w-]+/.)+[/w-]+.([^a-z])(/[/w-: ./?%&=]*)?|[a-zA-Z0-9/-/.][/w-]+.([^a-z])(/[/w-: ./?%&=]*)?
怎么来这一出 2012-10-08
  • 打赏
  • 举报
回复
谢谢“lzxue1989”和“q107770540”两位的都很好用,结贴!
q107770540 2012-10-08
  • 打赏
  • 举报
回复
(?i)https?://\S*?/\d+\.shtml
csdn_风中雪狼 2012-10-08
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 的回复:]
引用 2 楼 lzxue1989 的回复:

C# code

string s = ",比如http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml 这种";
s = Regex.Match(s, @"[a-zA-z]+://[^\s]*").ToString();
System.Diagnostics.Debug.P……
[/Quote]
匹配出来,在判断下
修改这样

string s = "http://style.t.sina.com.cn/index.shtml http://roll.style.sina.com.cn/fas/jewelry/index.shtml http://roll.style.sina.com.cn/time/guide/index.shtml http://roll.style.sina.com.cn/tas/cigar/index.shtml http://roll.style.sina.com.cn/tas/club/index.shtml http://roll.style.sina.com.cn/lei/hotels/index.shtml http://roll.style.sina.com.cn/lei/cars/index.shtml http://roll.style.sina.com.cn/lei/yachting/index.shtml http://roll.style.sina.com.cn/des/architecture/index.shtml http://roll.style.sina.com.cn/industry/index.shtml http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml";

Regex re = new Regex(@"[a-zA-z]+://[^\s]*");

MatchCollection mc = re.Matches(s);

string t = string.Empty;

foreach (Match m in mc)
{
if (Regex.IsMatch(m.ToString(), @"[a-zA-z]+://[\s\S]*?/[0-9]+.shtml"))
{
System.Diagnostics.Debug.Print(m.ToString());
}
}
//输出 http://style.sina.com.cn/industry/2012-10-08/1147106801.shtml
内容概要:本文围绕基于三重移相控制(TPS)的双有源桥(DAB)高频隔离DC-DC变换器开展系统性研究,重点构建了其在Simulink环境下的高精度仿真模型。研究全面涵盖SPS单相移相、DPS双重重移相与TPS三重移相等多种控制策略的建模、实现与性能对比,深入分析不同模式下变换器的功率传输特性、软开关实现条件及功率回流问题,旨在提升DAB在交直流混合微电网、能量路由器、多端口柔性互联装置等场景中的转换效率与动态响应能力。通过对ZVS(零电压切换)条件的精确控制与移相角参数的优化,有效降低了开关损耗,增强了系统整体能效与运行稳定性。该仿真模型具有良好的可扩展性,适用于复杂电能转换系统的科研验证与工程开发。; 适合人群:电力电子、电气工程及其自动化等相关专业的硕士研究生、博士生、科研人员以及从事新能源变换器、柔性输配电系统设计的工程技术人员。; 使用场景及目标:①掌握双有源桥DAB变换器的基本工作原理及其在高频隔离场合的核心优势;②深入理解三重移相控制策略的设计机理、控制自由度分配及其在效率优化中的关键作用;③构建并调试可用于科研论文撰写、项目申报或实际系统验证的高保真Simulink仿真模型,支撑理论分析与实验对比。; 阅读建议:建议结合MATLAB/Simulink平台进行动手实践,重点关注主电路拓扑搭建、移相控制模块设计、驱动信号时序配置及ZVS实现条件的仿真观测,推荐通过对比SPS、DPS与TPS三种模式的稳态与动态响应曲线,深入掌握各控制策略的适用边界与优化方向。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!

62,269

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧