python爬虫的若干问题

mails2008 2017-03-18 06:24:12
写在用paython写一个爬虫相对简单了很多,用requests, beautifulsoup,在懂点正则和网络知识,基本上就能简单爬取一个网站了。
但是现实中遇到很多问题,比如字体编码,网站限制,客户端重定向,验证码,ajax等问题。每个网站的结构不同,正则也不同。
或许只能广泛的搜索和保存连接和标题?
有没有好的方法,在网络上采集关键字内容呢?
互联网海洋的水太深了,大海捞针,想法美好,现实残酷。
...全文
666 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
从此不换网名 2017-04-10
  • 打赏
  • 举报
回复
虽然我不懂,但我帮你顶起来!!希望有一天我能帮你!顺便问一下楼主,python好学习吗?go语言可以写爬虫吗?

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧