一个网页采集的问题

pptipdert 2011-03-03 11:49:46
采集一个网页遇到了用
<script>window.location='http:// ';</script>跳转的问题,需要采集到<script>window.location='http:// ';</script>中的内容来采集下一个网页的内容,但网页用了<script> </script>的标志,采集回来的内容是空的,请教一下高手,要怎么才能在程序中采回<script> </script>中间的内容?
...全文
70 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
bingo_ 2011-03-04
  • 打赏
  • 举报
回复
用正则取到url后再请求采集


"<script>window.location='(.*?)';</script>"
jianshao810 2011-03-04
  • 打赏
  • 举报
回复
一楼的有意义吗?楼主的是 httpWebrequest 来采集?还是那个winform控件来采集?
pptipdert 2011-03-04
  • 打赏
  • 举报
回复
是我自己搞错了,跟这个没关系,不过还是谢谢各位老大
robake 2011-03-04
  • 打赏
  • 举报
回复
楼主,你取网页内容的时候可以不使用webcilent之类的组件直接取源码,你这种情况可以使用webbrowser控件,让webbrowser去访问页面,从webbrowser中取代码~
pptipdert 2011-03-04
  • 打赏
  • 举报
回复
我知道是用正则,现在主要问题是有了"<script> <\script>这个标志后,它们中间的内容我不知道怎么采集到。要采集到中间的内容后才用正则取出来。
pptipdert 2011-03-03
  • 打赏
  • 举报
回复
老大可以讲讲大概的方法和原理吗
EastonSoft 2011-03-03
  • 打赏
  • 举报
回复
我写了一个组件可以采集,但是不能给你。

110,533

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧