社区
Java SE
帖子详情
抓网页问题,如何判断网页是否已经更新过?
jk3278jk
2006-06-13 10:28:04
做一个抓网页程序,要每隔30分钟抓取某网页一次,但前提是此网页内容已经更新,才抓取网页内容,这样能明显减少服务器的负担和流量。
不知道怎么样判断网页是否已经更新过?搜索到了一几个文章说是判断状态码304,也没看太懂。
哪位朋友做过这方面的程序,指点一下。谢谢。
...全文
506
18
打赏
收藏
抓网页问题,如何判断网页是否已经更新过?
做一个抓网页程序,要每隔30分钟抓取某网页一次,但前提是此网页内容已经更新,才抓取网页内容,这样能明显减少服务器的负担和流量。 不知道怎么样判断网页是否已经更新过?搜索到了一几个文章说是判断状态码304,也没看太懂。 哪位朋友做过这方面的程序,指点一下。谢谢。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
18 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sammyjeep
2006-06-24
打赏
举报
回复
思路和楼上的差不多吧,反正是有时间戳的,取来比较一下:)
phpxer
2006-06-24
打赏
举报
回复
你可以打开网页取得头部信息,然后断开连接。
如果“last modified”符合你的要求,就下载,否则,查看下一个网页。
具体不是特别清楚,一个思路。应该是可以的,你看看吧。
jk3278jk
2006-06-23
打赏
举报
回复
楼上说什么呢?开口就骂人?不解决问题?
xiaoyan0413
2006-06-22
打赏
举报
回复
LZRP有问题,不具备做人的基本素质,SB一个
我还来接分,呵呵
mingyun310
2006-06-22
打赏
举报
回复
顶.学习一下.
jk3278jk
2006-06-19
打赏
举报
回复
怎么弄?
wdmzjsxx
2006-06-18
打赏
举报
回复
没做过,帮你UP下
sammyjeep
2006-06-18
打赏
举报
回复
时间戳
jk3278jk
2006-06-17
打赏
举报
回复
up
jk3278jk
2006-06-16
打赏
举报
回复
up
jk3278jk
2006-06-14
打赏
举报
回复
up
boydream
2006-06-14
打赏
举报
回复
关注一下
jk3278jk
2006-06-13
打赏
举报
回复
又搜索到一篇文章,不过是php。
http://www.woodpecker.org.cn/obp/diveintopython/zh-cn/dist/html/http_web_services/etags.html
csdn到底有没有解决问题?估计都是光说不练的主!!!
jk3278jk
2006-06-13
打赏
举报
回复
又搜索了几篇文章好像是判断 header 的 "Last-modified"
再搜索吧。一下!还来csdn是摆设,还得靠自己啊。
jk3278jk
2006-06-13
打赏
举报
回复
还在的。请能者解决,谢谢
ttaallkk1
2006-06-13
打赏
举报
回复
楼主还在吗?
jk3278jk
2006-06-13
打赏
举报
回复
csdn有一点不太好,如果问题自己搞懂了,没靠别人帮助,是不是也得给分啊。哈哈。。
liujiwe79
2006-06-13
打赏
举报
回复
内容更新必须你重新打开网页或者你刷新了网页,不然,网页怎么更新呢,更新的时候你可以做个标记
qt-creator-opensource-linux-x86_64-13.0.0.run
qt-creator-opensource-linux-x86_64-13.0.0.run
2023-04-06-项目笔记 - 第一百零六阶段 - 4.4.2.104全局变量的作用域-104 -2024.04.17
2023-04-06-项目笔记-第一百零六阶段-课前小分享_小分享1.坚持提交gitee 小分享2.作业中提交代码 小分享3.写代码注意代码风格 4.3.1变量的使用 4.4变量的作用域与生命周期 4.4.1局部变量的作用域 4.4.2全局变量的作用域 4.4.2.1全局变量的作用域_1 4.4.2.104全局变量的作用域_104 - 2024-04-17
1.zip
1
一个简单的Fortran脚本示例,它会读取用户输入的两个整数,然后计算它们的和与乘积,最后将结果输出到屏幕上
Fortran是一种编译型语言,这意味着你需要先使用编译器将源代码编译成可执行文件,然后才能运行它。 在这个示例中,我们使用了Fortran 90/95/2003/2008/2018的语法,因为它是最广泛使用的现代Fortran版本之一。Fortran的不同版本在语法和特性上可能会有所不同,但这个示例应该在大多数现代Fortran编译器中工作。 implicit none语句用于确保所有变量在使用前都必须显式声明,这是一种良好的编程实践,可以避免潜在的错误。 print *和read *分别用于输出和输入操作。星号*表示输出/输入应该使用默认的格式。
5V继电器控制模块原理图+教程.7z
5V继电器控制模块原理图+教程.7z
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章