社区
Java SE
帖子详情
抓网页问题,如何判断网页是否已经更新过?
jk3278jk
2006-06-13 10:28:04
做一个抓网页程序,要每隔30分钟抓取某网页一次,但前提是此网页内容已经更新,才抓取网页内容,这样能明显减少服务器的负担和流量。
不知道怎么样判断网页是否已经更新过?搜索到了一几个文章说是判断状态码304,也没看太懂。
哪位朋友做过这方面的程序,指点一下。谢谢。
...全文
523
18
打赏
收藏
抓网页问题,如何判断网页是否已经更新过?
做一个抓网页程序,要每隔30分钟抓取某网页一次,但前提是此网页内容已经更新,才抓取网页内容,这样能明显减少服务器的负担和流量。 不知道怎么样判断网页是否已经更新过?搜索到了一几个文章说是判断状态码304,也没看太懂。 哪位朋友做过这方面的程序,指点一下。谢谢。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
18 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sammyjeep
2006-06-24
打赏
举报
回复
思路和楼上的差不多吧,反正是有时间戳的,取来比较一下:)
phpxer
2006-06-24
打赏
举报
回复
你可以打开网页取得头部信息,然后断开连接。
如果“last modified”符合你的要求,就下载,否则,查看下一个网页。
具体不是特别清楚,一个思路。应该是可以的,你看看吧。
jk3278jk
2006-06-23
打赏
举报
回复
楼上说什么呢?开口就骂人?不解决问题?
xiaoyan0413
2006-06-22
打赏
举报
回复
LZRP有问题,不具备做人的基本素质,SB一个
我还来接分,呵呵
mingyun310
2006-06-22
打赏
举报
回复
顶.学习一下.
jk3278jk
2006-06-19
打赏
举报
回复
怎么弄?
wdmzjsxx
2006-06-18
打赏
举报
回复
没做过,帮你UP下
sammyjeep
2006-06-18
打赏
举报
回复
时间戳
jk3278jk
2006-06-17
打赏
举报
回复
up
jk3278jk
2006-06-16
打赏
举报
回复
up
jk3278jk
2006-06-14
打赏
举报
回复
up
boydream
2006-06-14
打赏
举报
回复
关注一下
jk3278jk
2006-06-13
打赏
举报
回复
又搜索到一篇文章,不过是php。
http://www.woodpecker.org.cn/obp/diveintopython/zh-cn/dist/html/http_web_services/etags.html
csdn到底有没有解决问题?估计都是光说不练的主!!!
jk3278jk
2006-06-13
打赏
举报
回复
又搜索了几篇文章好像是判断 header 的 "Last-modified"
再搜索吧。一下!还来csdn是摆设,还得靠自己啊。
jk3278jk
2006-06-13
打赏
举报
回复
还在的。请能者解决,谢谢
ttaallkk1
2006-06-13
打赏
举报
回复
楼主还在吗?
jk3278jk
2006-06-13
打赏
举报
回复
csdn有一点不太好,如果问题自己搞懂了,没靠别人帮助,是不是也得给分啊。哈哈。。
liujiwe79
2006-06-13
打赏
举报
回复
内容更新必须你重新打开网页或者你刷新了网页,不然,网页怎么更新呢,更新的时候你可以做个标记
C语言笔记01(7.15-7.18)
C语言基本知识点思维导图
【智能汽车竞赛】摄像头组-长春理工大学-天狼五号技术赛方案.docx
【智能汽车竞赛】摄像头组-长春理工大学-天狼五号技术赛方案.docx
MATLAB中计算可达矩阵的实现方法
资源下载链接为: https://pan.quark.cn/s/abbae039bf2a 请用MATLAB编程实现从邻接矩阵计算可达矩阵。
hadoop-mapreduce-client-jobclient-2.7.3.jar中文文档.zip
1、压缩文件中包含: 中文文档、jar包下载地址、Maven依赖、Gradle依赖、源代码下载地址。 2、使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 3、特殊说明: (1)本文档为人性化翻译,精心制作,请放心使用; (2)只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; (3)不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 4、温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件。 5、本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册。
jetty-server-9.4.44.v20210927.jar中文文档.zip
1、压缩文件中包含: 中文文档、jar包下载地址、Maven依赖、Gradle依赖、源代码下载地址。 2、使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 3、特殊说明: (1)本文档为人性化翻译,精心制作,请放心使用; (2)只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; (3)不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 4、温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件。 5、本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册。
Java SE
62,634
社区成员
307,266
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章