社区
基础编程
帖子详情
怎样防止别人的程序自动抓取我的网页
wutingting_123456789
2005-10-14 12:35:41
很多CMS 比如iNews CMSWare之类的东西可以自动抓取别人的网页
一般都使用正则表达式分析我的网页代码
怎么才能有效的防止这种东西呢
插入干扰代码?但是不知道加地方 加在什么地方合适 会不会对自己的编辑也产生影响
共同探讨
...全文
369
18
打赏
收藏
怎样防止别人的程序自动抓取我的网页
很多CMS 比如iNews CMSWare之类的东西可以自动抓取别人的网页 一般都使用正则表达式分析我的网页代码 怎么才能有效的防止这种东西呢 插入干扰代码?但是不知道加地方 加在什么地方合适 会不会对自己的编辑也产生影响 共同探讨
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
18 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lzkd
2005-10-18
打赏
举报
回复
你抓eBay的商品目录了么?或者猜雅虎用户的密码?或者抓google所有的搜索结果?
*********************
别的不知道---或者抓google所有的搜索结果?---这个我公司有个达人做到的.用什么写的,没问.
Gdj
2005-10-18
打赏
举报
回复
现在流行的是变形滤镜配合汉字识别码了。
poolnet
2005-10-18
打赏
举报
回复
防不胜防,对输出代码进行随机的大小写变换估计能够搞定一部分程序
Gdj
2005-10-18
打赏
举报
回复
嗯。web上的东西只要眼睛能看到的就100%能抓。多加些限制,只是难度不同罢了。连图片都不保险,一些图片识别软件还不到1M。所以现在的识别码图片都做得严重变形,差点眼睛都认不出来了。
黑夜路人
2005-10-18
打赏
举报
回复
抓网页的技术叫做网络蜘蛛
就是由于机器人(Bot)通过自动程序,一直抓取网页, 有深度搜索和广度搜索, 抓取后保存在cache中,然后其他程序来分析文件,提取有用信息保存起来.
myspsp
2005-10-18
打赏
举报
回复
抓别人网页上面的文本是什么样的一个技术来着?
原理该是怎样啊?
Gdj
2005-10-18
打赏
举报
回复
抓商品目录搜索结果的什么可以。不知道你抓别人的密码是什么原理?雅虎有把别人的密码公布出来的习惯?
myspsp
2005-10-18
打赏
举报
回复
一直想不明白该怎么抓取网页里面特定的信息!
该怎么处理!
哪位朋友可否提点一下!
iisbsd
2005-10-18
打赏
举报
回复
我不知道了。
你抓eBay的商品目录了么?或者猜雅虎用户的密码?或者抓google所有的搜索结果?
yunfeifan
2005-10-15
打赏
举报
回复
to GaoXX(我即老高,老高即我)
远程抓取也可以伪造useragent ,这样的事情只要不是太出格就完了,如果太出格就封ip吧
也可以考虑js,把部分代码隐藏,不过都是对一些不太懂得人。
Gdj
2005-10-15
打赏
举报
回复
Yahoo google ebay我都抓了。你重新列几个吧。
iisbsd
2005-10-15
打赏
举报
回复
可以做到的,大的网站像Yahoo,google,ebay都有这个功能。
我不能多说了。:D
chinatino
2005-10-14
打赏
举报
回复
有好办法,你可以用GD,把文章都写到图片上
-神仙-
2005-10-14
打赏
举报
回复
用session。
ppq886
2005-10-14
打赏
举报
回复
没有什么好的办法吧,如果用apache骗骗简单的人还行,不过抓网页的人都比较专业,所以好像很难
GaoXX
2005-10-14
打赏
举报
回复
回复人: jstones(jonny) ( ) 信誉:100 2005-10-14 14:45:00 得分: 0
不管你做的多么好,那也是html或者javascript之类的显示的。
没办法!
放弃吧!
===================
肯定最后都可以看到 这是协议先天的 没有办法
但那是“你”可以看到
机器人只会重复简单的有规律的事情
回复人: yunfeifan(云飞凡) ( ) 信誉:94 2005-10-14 14:57:00 得分: 0
直接修改apache的配置利用ip useragent 和referer等技术
但是像彻底防止,不太容易。
============
确实 远程打开的一般都没有发送user-agent
yunfeifan
2005-10-14
打赏
举报
回复
直接修改apache的配置利用ip useragent 和referer等技术
但是像彻底防止,不太容易。
jstones
2005-10-14
打赏
举报
回复
不管你做的多么好,那也是html或者javascript之类的显示的。
没办法!
放弃吧!
如何提取小
程序
/APP/
网页
里图片视频,小
程序
APP素材
抓取
软件批量下载图片音频?
如何提取小
程序
/APP/
网页
里图片视频,小
程序
APP素材
抓取
软件批量下载图片音频?
python
网页
抓取
_Python简单实现
网页
内容
抓取
功能示例
怎么用python
抓取
网页
并实现一些提交操作?不要拿小编很任何人比小编不是谁的影子更不是谁的替代品如何用python
抓取
这个
网页
的内容?如何用Python爬虫
抓取
网页
内容?人生有你,阳光灿烂;人生有你,四季温暖;人生有...
抓取
微信小
程序
数据加密内容
最近又收到个任务,要去
抓取
别人小
程序
的内容,通过fiddler抓包,请求和响应数据看的我是一脸懵逼,自己造数据是不可能的,小
程序
看不到js,根本猜不到怎么解密和加密的。网上也有文章说小
程序
的源码可以通过反编译...
抓取
网页
数据的几种方法
相信所有个人网站的站长都有
抓取
别人数据的经历吧,目前
抓取
别人网站... 本人起初也曾试着用第三方的工具
抓取
我所需要的数据,由于网上的流行的第三方工具不是不符合我的要求,就是过于复杂,我一时没有搞明白怎么用
Ajax
网页
源码
抓取
程序
然后经过我的仔细研究,花了两天的时间写了一个
抓取
网页
信息的
程序
,尤其是对使用了Ajax
网页
来说非常有用。本
程序
没有像蜘蛛那样的爬行功能,只能对特定的网址进行
抓取
,但你可以导入一批网址进行
抓取
1.运行。。。2....
基础编程
21,887
社区成员
140,363
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章