[爬虫资源]各大爬虫资源大汇总,做我们自己的awesome系列

人傻且呆但不萌 2016-10-11 02:35:00
Awesome-crawlerawesome
A collection of awesome web crawler,spider and resources in different language

Python
Scrapy - A fast high-level screen scraping and web crawling framework.
pyspider - A powerful spider system.
cola - A distributed crawling framework.
Demiurge - PyQuery-based scraping micro-framework.
feedparser - Universal feed parser.
Grab - Site scraping framework.
MechanicalSoup - A Python library for automating interaction with websites.
portia - Visual scraping for Scrapy.
crawley - Pythonic Crawling / Scraping Framework based on Non Blocking I/O operations.
RoboBrowser - A simple, Pythonic library for browsing the web without a standalone web browser.
MSpider - A simple ,easy spider using gevent and js render.
这是其中的一部分,还有其它相应语言的优秀爬虫框架在github里面,更多的请移步到github中

==>https://github.com/BruceDone/awesome-crawler<==
...全文
323 1 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
csdn的帖子竟然还不支持MD 我。。。
资源下载链接为: https://pan.quark.cn/s/06ab561f12b8 以下是重新整理后的内容: awesome-go 是一个由 Go 社区发起并维护的 Go 资源列表,内容涵盖音频和音乐库、认证与 OAuth 授权、机器人相关、命令行工具、数据库、机器学习、物联网、中间件、文本处理、安全、自然语言处理、网络相关库、持续集成、服务端应用、流处理等众多领域。该列表是目前最全面的 Go 资源汇总之一,英文版已积累大量关注,中文版由相关团队维护更新,也会定期同步至英文版。 在音频和音乐库方面,有原生 Go 语言编写的 FLAC 数据流编解码器 flac、AAC 比特流解析器 gaad、音频处理库 GoAudio 等;认证和 OAuth 授权领域,有模块化认证系统 authboss、基于角色的访问控制实现 gorbac、JWT 的 Golang 实现 jwt-go 等;机器人相关资源中,有用于编写聊天机器人的 go-chat-bot、受 Hubot 启发的通用型机器人库 go-joe、机器人服务器 tbot 等;命令行工具里,有功能强大的命令行软件库 cli、命令行笔记工具 Dnote、命令补全工具 complete 等;数据库方面,有键值存储库 badger、嵌入式键值数据库 bbolt、分布式键值存储 Vasto 等;机器学习领域,有贝叶斯分类器 bayesian、神经网络库 fonet、通用机器学习库 GoLearn 等;物联网相关,有机器人库 gobot、物联网消息系统 go-mqtt 等;中间件方面,有创建 HTTP 中间件的代码库 go-middleware、中间件框架 negroni 等;文本处理领域,有字符串操作库 go-formatter、文本对齐工具 align、爬虫框架 colly 等;安全领域,有客户端工具 acmetool、网络加密代理

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧