哪里有抓取web(HTML)的服务?

jb2008 2016-06-12 10:44:30
我只提供URL,自动抓取HTML代码,只要HTML代码,抓取的主要是国外的网站。
现在自己做了一个下载程序,但抓多了会被封IP。

国外有这服务接口吗? 收费的也行。
...全文
392 18 打赏 收藏 转发到动态 举报
写回复
用AI写文章
18 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
引用 16 楼 jb2008 的回复:
[quote=引用 14 楼 she6600 的回复:] 因为代理Ip的话,有些ip可能访问不到你指定的网页,你对这个介意吗?另外如果需要购买代理Ip,你介意吗?
可以使用代理,甚至换不同的VPN,这样变化本机的IP;你愿意做吗? [/quote] 你好,看一下你的私信
  • 打赏
  • 举报
回复
因为代理Ip的话,有些ip可能访问不到你指定的网页,你对这个介意吗?另外如果需要购买代理Ip,你介意吗?
  • 打赏
  • 举报
回复
如果不是取特定的内容,直接用winfrom 输入url WebBrowser定向获取内容保存html不就好了? 抓取的时候根据次动态换Ip
jb2008 2016-08-11
  • 打赏
  • 举报
回复
还是没有找到好的办法,精力有限,希望有收费的网页下载服务推荐,我只提供URL,你给我返回HTML即可。 有哪位高手,愿意做这个程序也行,比如换不同代理来实现。 有酬谢!
jb2008 2016-08-11
  • 打赏
  • 举报
回复
引用 6 楼 sp1234 的回复:
首先,你所谓的 url 是否真正是你要下载的 html。许多现代的网页上的 html 可能是几百次动态改变之后的。如果你保证只需要你提供的 url 的初始的 html 内容,这个才靠谱。 其次,你能出多少钱?如果人家要1万,你只给200,这就成了小孩子游戏了。
不要说这些空洞话,做得出来,可以出1万。
jb2008 2016-08-11
  • 打赏
  • 举报
回复
引用 14 楼 she6600 的回复:
因为代理Ip的话,有些ip可能访问不到你指定的网页,你对这个介意吗?另外如果需要购买代理Ip,你介意吗?
可以使用代理,甚至换不同的VPN,这样变化本机的IP;你愿意做吗?
真相重于对错 2016-08-11
  • 打赏
  • 举报
回复
google baidu 搜狗这些东西都是用到了你提出的技术,他们怎么不会被封呢? 所以还是你写的程序有问题! 每一行,必须有每一行的规矩,所以你的程序也要准守这一行的规则,而不是任性胡为!
jb2008 2016-06-23
  • 打赏
  • 举报
回复
看来还是得自己动手做这个程序? 没有这样的收费服务接口了。
  • 打赏
  • 举报
回复
楼主你好,你是不是想做下载别人的页面的一个程序?如果是的话,很简单那,去买几个代理服务器的IP,你尝试抓取次数,你看抓多少次了,就封IP,如果抓100次就封IP,那么你就循环100次换一个IP,还有就是,如果是按照频率封的,那你就做一个挂起,1秒执行一次或者10秒执行一次。这样是为了抓取更多的数据。
BillHu233 2016-06-16
  • 打赏
  • 举报
回复
你看看苏飞助手行不行呢,专门做爬虫的,你用url或者一个页面的element,然后获取他的html应该是可以的吧
by_封爱 2016-06-16
  • 打赏
  • 举报
回复
代理服务器 每天搜索免费的代理 然后自动换被
jb2008 2016-06-16
  • 打赏
  • 举报
回复
引用 6 楼 sp1234 的回复:
首先,你所谓的 url 是否真正是你要下载的 html。许多现代的网页上的 html 可能是几百次动态改变之后的。如果你保证只需要你提供的 url 的初始的 html 内容,这个才靠谱。 其次,你能出多少钱?如果人家要1万,你只给200,这就成了小孩子游戏了。
URL是固定的,有这样的服务吗?问题现在是要找到稳定的服务接口,再来谈钱。
myhope88 2016-06-15
  • 打赏
  • 举报
回复
用代理服务器,不断的换IP地址
  • 打赏
  • 举报
回复
首先,你所谓的 url 是否真正是你要下载的 html。许多现代的网页上的 html 可能是几百次动态改变之后的。如果你保证只需要你提供的 url 的初始的 html 内容,这个才靠谱。 其次,你能出多少钱?如果人家要1万,你只给200,这就成了小孩子游戏了。
jb2008 2016-06-15
  • 打赏
  • 举报
回复
引用 4 楼 myhope88 的回复:
用代理服务器,不断的换IP地址
我不想去开发这个程序,我只提供URL,接口返回HTML就行,见过这样的服务吗?
孙大诚_SunRobin 2016-06-14
  • 打赏
  • 举报
回复
你自己写代码去读取服务器的HTML跟浏览器不停的刷新是一个道理的,都是HTTP请求,然后返回HTML.
jb2008 2016-06-13
  • 打赏
  • 举报
回复
我要让程序自动调用,在大量网页要下载。
範先森 2016-06-12
  • 打赏
  • 举报
回复
打开网页不就可以看到html代码么,打开之后另存为就能整个网页存下来啊

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧