请教各位前于webbrowser取网页链接地址的问题

fisher12345 2015-12-11 10:35:18
最近用webbrowser取网页地址,主要是最页码链接,比如http://www.cssn.cn/zx/201512/t20151203_2739040.shtml,但用Document.Links取出来的是t20151203_2739040_1.shtml,查看源码是href=\"t20151203_2739040"+"_" + nextPage + "."+"shtml\" target=\"_self\">下一页,在浏览里点右链是能查看到该地址实际为http://www.cssn.cn/zx/201512/t20151203_2739040_1.shtml,我就没搞懂,浏览器怎么知道“\"这个根是http://www.cssn.cn/zx/201512/,也就是 我怎样才能得到网站的根地址是什么,然后把它加上我采到的网址得到真实链接地址!好多东西在webbrowser已经呈现了,但就是不知道是怎么来的!谢谢了!
...全文
75 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
fisher12345 2015-12-12
  • 打赏
  • 举报
回复
搞定了,谢谢!
fisher12345 2015-12-12
  • 打赏
  • 举报
回复
谢谢,用正则表达式能提取出来吗?源码是<A class=fenyepage href="t20151203_2739040_1.shtml" target=_self>2</A>,如何能匹配为http://www.cssn.cn/zx/201512/t20151203_2739040_1.shtml呢
threenewbee 2015-12-11
  • 打赏
  • 举报
回复
正则表达式提取下 (?<=http\:\/\/)[^\/]+

110,533

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧