一个网页采集的问题

pptipdert 2011-03-03 11:49:46

采集一个网页遇到了用
<script>window.location='http:// ';</script>跳转的问题，需要采集到<script>window.location='http:// ';</script>中的内容来采集下一个网页的内容，但网页用了<script> </script>的标志，采集回来的内容是空的，请教一下高手，要怎么才能在程序中采回<script> </script>中间的内容？

...全文

70 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

bingo_ 2011-03-04

打赏
举报

用正则取到url后再请求采集



"<script>window.location='(.*?)';</script>"

jianshao810 2011-03-04

打赏
举报

一楼的有意义吗？楼主的是 httpWebrequest 来采集？还是那个winform控件来采集？

pptipdert 2011-03-04

打赏
举报

是我自己搞错了，跟这个没关系，不过还是谢谢各位老大

robake 2011-03-04

打赏
举报

楼主，你取网页内容的时候可以不使用webcilent之类的组件直接取源码，你这种情况可以使用webbrowser控件，让webbrowser去访问页面，从webbrowser中取代码~

pptipdert 2011-03-04

打赏
举报

我知道是用正则，现在主要问题是有了"<script> <\script>这个标志后，它们中间的内容我不知道怎么采集到。要采集到中间的内容后才用正则取出来。

pptipdert 2011-03-03

打赏
举报

老大可以讲讲大概的方法和原理吗

EastonSoft 2011-03-03

打赏
举报

我写了一个组件可以采集，但是不能给你。

本课程是基于LINUX系统的视频采集和显示系统的实战课，其中涉及的内容是机器视觉领域最基础也是最重要的内容，是每一个从事该领域的工程师都应该掌握的技术！本课程的应用领域和背景是什么？机器视觉领域...

本文使用Python爬虫技术实现一个简单的网页采集器功能。

如何收集网页数据，来实现数据分析、AI数据训练、数据拓客使用，是目前所有人面临的一个技术问题。如果市场上有个技术或者有个工具可以聚合这些数据的话，我觉得将会促进大数据+AI的发展。数据采集根据采集数据的...

因此，尽管链接对于搜索引擎优化很重要，但是你应该确保它们不会妨碍你想要传达的信息，以及不影响用户阅读的体验。而K一般优化不优化都不...编写链接文本的一个良好做法是将链接的文本与要链接的页面内容进行匹配。

网页数据采集可以应用于各行各业，发展到现在，它有着广泛的用途，这里列举一些比较常见的用途，当然他的用途不止这些，要列举的很细的话，上千条都能列出来。3. 采集淘宝某店铺的所有商品，然后放到自己店铺，有人...

110,533

社区成员

642,574

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章