社区
.NET技术前瞻
帖子详情
.Net 为什么没有网络爬虫!!! 大神搭建一个吧!!!!
hua841692609
2015-11-11 11:29:59
请求.net 大神 搭建一个!!!
...全文
1155
10
打赏
收藏
.Net 为什么没有网络爬虫!!! 大神搭建一个吧!!!!
请求.net 大神 搭建一个!!!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
10 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
iReachers
2016-03-15
打赏
举报
回复
提供个思路吧: 1.利用正则表达式分析网页中的连接 2.递归的去爬取网页的链接 3.为了去除已经爬过的网站,利用hash 其实写爬虫最多遇到的问题是服务器屏蔽爬虫,所以怎么和服务器斗智斗勇是最关键的。。。
nry19871012
2016-03-14
打赏
举报
回复
不同的站点 数据匹配是不一样的。并没有通用的。
yanran_hill
2016-02-25
打赏
举报
回复
去OSChina,看一下NCrawler,据说是C#写的
宋世鹏宇宙信息网
2016-02-06
打赏
举报
回复
有爬虫的codeproject上面有。不过这个东西运行效率不高。爬虫一定要高效 百度的爬虫是c做出来的。连c++都不能有。 我那时候被面试。上面明确表明linux加c。不能写成c++ 因为c++效率也下降了一点。
一枚弹壳
2015-11-23
打赏
举报
回复
如果你想爬别人网站上面的数据有专门的工具,你可以百度搜索一下, 你要想写代码那就每个网站么个页面都得自己写 。
lcjSharp
2015-11-12
打赏
举报
回复
都是有针对性的抓吧,不过有些通用的部分可以考虑写出来共享
娃都会打酱油了
2015-11-11
打赏
举报
回复
网络爬虫都是要定向写的,哪有通用的
hua841692609
2015-11-11
打赏
举报
回复
YOU MEI YOU
一天到晚游泳的鱼2016
2015-11-11
打赏
举报
回复
比如你抓网易新闻列表,分析列表结构,url结构,取标题,内容,生成索引
卧槽这是我的昵称吗
2015-11-11
打赏
举报
回复
你说的是方法?还是爬具体某个网站?后者的话你还是老老实实自己写吧,前者,不就是获取http返回的内容么?c#发个http请求总会吧
150讲轻松学习Python
网络
爬虫
【为什么学
爬虫
?】 1、
爬虫
入手容易,但是深入较难,如何写出高效率的
爬虫
,如何写出灵活性高可扩展的
爬虫
都是一项技术活。另外在
爬虫
过程中,经常容易遇到被反
爬虫
,比如字体反爬、IP...
自己动手
搭建
一个
简单的基于Hadoop的离线分析系统之一——
网络
爬虫
自己动手
搭建
一个
基于Hadoop的离线分析系统
爬虫
博客推荐及个人笔记(闲聊时刻)
https://blog.csdn
.net
/qiulin_wu/article/details/104774594- 一入
爬虫
深似海,反爬技术你知多少? 笔记:之前也做过基于
网络
爬虫
的数据分析系统。也写过
爬虫
,在做数据分析系统的时候,主要的
爬虫
部分开发不属于...
Python
爬虫
实战 | (18)
搭建
IP代理池
IP代理池是通用的,创建好后,可供多个
爬虫
任务共同使用。
搭建
IP代理池主要分为4个基本模块:存储模块、获取模块、检测模块、接口模块。 1)存储模块: 负责存储代理IP。 2)获取模块: 定时在各大代理网站抓取...
[分享] 用NodeJs做
一个
小
爬虫
,附源码!
前言 利用
爬虫
可以做很多事情,单身汉子们可以用...抛开机器学习这种貌似很高大上的数据处理技术,单纯的做
一个
爬虫
获取数据还是非常简单的。对于前段er们来说,生在有nodejs的年代真是不要太幸福了,下面就用nodej...
.NET技术前瞻
13,347
社区成员
5,388
社区内容
发帖
与我相关
我的任务
.NET技术前瞻
.NET技术 .NET技术前瞻
复制链接
扫一扫
分享
社区描述
.NET技术 .NET技术前瞻
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章