社区
脚本语言
帖子详情
Python爬虫只更新更新过的数据
ktoya
2016-08-12 05:08:23
有一个爬虫,每5秒爬一个xml网页,
http://www.228cai.com/data/yp101.xml
把每行数据都传到数据库里
这个网页会一直更新,但有很多行在5秒内它是不更新的。
现在的做法很笨,删除数据库所有数据,再重新Insert全部,效率很慢。
现在想换成另外的做法,第一次爬的时候Insert所有数据,5秒后开始第二次爬虫以后只更新更新过的数据,求教做法。
...全文
834
4
打赏
收藏
Python爬虫只更新更新过的数据
有一个爬虫,每5秒爬一个xml网页, http://www.228cai.com/data/yp101.xml 把每行数据都传到数据库里 这个网页会一直更新,但有很多行在5秒内它是不更新的。 现在的做法很笨,删除数据库所有数据,再重新Insert全部,效率很慢。 现在想换成另外的做法,第一次爬的时候Insert所有数据,5秒后开始第二次爬虫以后只更新更新过的数据,求教做法。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
混沌鳄鱼
2016-11-24
打赏
举报
回复
你这个数据非常简单量又不大。 第一、数据表建立主键防止重复插入。看着好象第三列应该可以做了个主键,或者第二列+第三列联合主键。 第二、建立内存缓存,比如用redis,或者就用sqlite:memory, 批量写入数据库
CDSoftwareWj
2016-08-15
打赏
举报
回复
放内存啊~~~,有变动再更改啊
羽飞
2016-08-13
打赏
举报
回复
这得排重啊,数据量有多大?看看能不能用内存做缓存,排下重,再插入到数据库
sanxiaochengyu
2016-08-12
打赏
举报
回复
如果有字段能标记是否有更新过,就比较简单,如果没有,只能通过和数据库里面的内容来比较的话,还是直接删除再插入比较简单
Python
爬虫
进阶:Scrapy框架教程
Python
爬虫
进阶教程 掌握了
python
爬虫
基本理论和操作,本课程主要以讲授Scarpy框架来实现
python
爬虫
进阶 该课程主要分享
Python
爬虫
框架Scarpy的安装、使用、selector选择器的使用 spider的使用、itempipeline的使用...
Python
爬虫
如何实现抓取电影网站?
Python
爬虫
如何对电影网站信息进行爬取?
我们在之前学习过
python
爬虫
的知识,很多小伙伴在学习了
爬虫
之后都能够使用它去抓取一些网页上的
数据
了,但是对于一个网站的爬取还是有些问题存在的,所以这一篇文章将会以实际的代码示例来介绍
Python
爬虫
如何实现抓取电影网站?1、我们在使用
爬虫
对
数据
进行爬取的前,通过会对它进行环境的搭建,第一步就是对安装包进行下载,我们可以在
Python
官网中去找到合适自己的安装包,下载好之后,直接双击进入
Python
的安装向导。的全部内容了,相信大家都有了一定的了解,不妨动手试试吧!最后祝大家天天进步!
python
爬虫
爬取网页
数据
python
爬虫
爬取网页
数据
python
爬虫
是干嘛的?
python
爬虫
能做什么?
python
爬虫
可以用于收集
数据
,
爬虫
是一个
爬虫
程序,一个程序的运行速度是非常快的,而且不会因为重复的事情感到疲倦,接下来我们一起学习
python
爬虫
是干嘛用的,
python
爬虫
究竟能做什么呢?
python
爬虫
是什么?
python
爬虫
是干嘛的呢? 1、
python
爬虫
可以用来收集
数据
2、
Python
爬虫
可以刷流量和秒杀
python
爬虫
能做什么呢? 1、收集
数据
python
爬虫
用来收集
数据
是最直接和常用的方法,可以使用
python
爬虫
程序获得大量的
数据
,从而变得非常的简单和快速;绝大多数网站使用了模
如何使用
Python
爬虫
抓取
数据
?
Python
爬虫
应用十分广泛,无论是各类搜索引擎,还是日常
数据
采集,都需要
爬虫
的参与。其实
爬虫
的基本原理很简单,今天小编就教大家如何使用
Python
爬虫
抓取
数据
,感兴趣的小伙伴赶紧看下去吧!首先需要安装
Python
的requests和BeautifulSoup库。我们用Requests库用抓取网页的内容,使用BeautifulSoup库来从网页中提取
数据
。运行pip install requests运行pip install BeautifulSoup完成必要工具安装后,我们正式开始编写我们的
爬虫
。我们的第
脚本语言
37,720
社区成员
34,239
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章