采集程序的原理是什么？

php_wsd 2011-07-13 02:33:28

Function getHTTPPage(url,language)
'On Error Resume Next
dim http
set http=Server.createobject("Microsoft.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,language)
set http=Nothing
If Err.number<>0 then
Response.Write "<p align='center'><font color='red'><b>服务器获取文件内容出错</b></font></p>"
Err.Clear
End If
End Function

Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function

这是采集常用的两个函数。请问在采集的时候，程序是使用什么身份打开要采集的页面的？是使用哪个浏览器打开的吗？

...全文

104 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

一把编程的菜刀 2011-07-13

打赏
举报

回复

采集，用简单通俗的话来说，就是服务端远程打开某个页面进行读取。

也就是说与用什么浏览器无关

php_wsd 2011-07-13

打赏
举报

回复

谢谢大家，我已经成功模拟搜索引擎，采集到我要的页面了。

gingerkang 2011-07-13

打赏
举报

回复

请求的内容在不同的浏览器上表现的效果可能不一样，但内容是一样的。你获取的是内容。
不知道我理解对或者说明白了没？

php_wsd 2011-07-13

打赏
举报

回复

我在注册表中修改了一个地方，改后，我的IE就可以模拟搜索引擎打开页面效果一样，但是我和程序却没有得到这样的效果。
所以想了解一下采集使用的是哪个浏览器打开的，为什么？

挨踢直男 2011-07-13

打赏
举报

回复

就是像浏览器请求一个页面一样，一个是地址栏
你那个是通过程序

数据采集器或称掌上电脑是为了满足移动的数据采集和为商品流通环节而设计的，其具有一体性、机动性、体积小、重量轻、高性能，并适于手持等特点，可用于补充订货、接收订货、销售、入出库、盘点和库存管理以及物流管理等方面。有效地解决了商品在流转过程中数据的标识和数量确认的问题，是保证系统的信息快速、准确进行处理的有效手段。那么，数据采集器工作原理是什么，你知道吗？这里物联云仓小编解答一下。数据采集器它具有中央...

不过，大家一定要注意哦，可爬取的数据必须是公开的，非盈利的，如：如果侵入人家非公开的网络，人家会通过ip定位到你，属于违法行为的哦，再或者，一些理财的网站，如果爬取数据，肯定是不可以的，如果小伙伴们不听话，非要去爬取，那任何人都是保护不了你的哦，狗头保命~~~看到这里，大家是不是发现通用爬虫简单，但是不实用，聚焦爬虫应用比较广泛，而且实用，但是实现起来难度较大，不过没事的哈，有宋宋的帮助，我们都能学会的，奥利给！期待大家学习完爬虫的全部课程之后，能有一个不错的收获~~~，Good Luck！

由于需要，要写一个简单的PHP采集程序，照例是到网上找了一堆教程，然后照猫画虎，可是发现网上的教程全是似是而非，没有一个真正能用的。苦想了几天，终于弄明白了里面的道理。在这里写出来，请高手指正。采集程序的思路很简单，无非就是先打一个页面，一般都是列表页，取得里面全部链接的地址，然后打开逐条链接，寻找我们感兴趣的东西，如果找到，就把它入库或别的处理。下面以一个很简单的例子来说说。首先确定一个

数据埋点是一种常用的数据采集方法。经过不断演化发展，由此所演变出的数据采集方法，已出现很多类型，并各具特点。经过不断演化发展，由此所演变出的数据采集方法，已出现很多类型，并各具特点。数据埋点的原理是什么？对基于用户行为的数据平台来说，发生在用户界面的、能获取用户信息的触点就是用户数据的直接来源，而建立这些触点的方式就是数据埋点。当这些触点获取到用户行为、身份数据后，会通过网络传输到服务器端进行...

IOT采集程序工作原理

28,409

社区成员

356,971

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章