社区
搜索引擎技术
帖子详情
获取.hk域下的所有网页的网址
coderfellow
2007-06-05 10:30:52
我现在需要获取.hk域下的所有网址,或者大部分网址,以便后续分析.
请问有什么办法可以获得这个域下的所有网址呢?
我试过网络蜘蛛,但是好像它需要有一个入口地址,那样就不是全部.hk域下的网址了.所以,现在我想不出办法了,希望得到大家的帮助,谢谢:-)
...全文
174
4
打赏
收藏
获取.hk域下的所有网页的网址
我现在需要获取.hk域下的所有网址,或者大部分网址,以便后续分析. 请问有什么办法可以获得这个域下的所有网址呢? 我试过网络蜘蛛,但是好像它需要有一个入口地址,那样就不是全部.hk域下的网址了.所以,现在我想不出办法了,希望得到大家的帮助,谢谢:-)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
James__Zhan
2009-10-31
打赏
举报
回复
可以,不过有个前提,最好其他所有的子页面到主页面之间有通路。
Java2King
2009-10-31
打赏
举报
回复
如果只抓取.hk的网站,肯定不能抓全。。
建议搞分布式两台电脑同时抓取,一台只抓.hk类网站,如果抓取其他域名就传给2号机。
2号机抓取分析,如果抓取到.hk类网站,就转1号机。
这样的话一号机上抓取的都是.hk域名的网站,而且资源绝对够
zhang_dongpeng
2009-09-18
打赏
举报
回复
广州达梦网络科技有限公司是一家致力于为提供各行业垂直搜索和元搜索服务的专业化公司。公司坚持以服务客户为中心,以技术创新为手段,为客户提供各个行业、任意搜索源精确搜索的解决方案,以及中个小企业信息服务的解决方案!
主要的搜索引擎案例有:万帮生活搜索,114soso网,万帮知识经验搜索,佛教新闻、网页、图片、视频、经典、词典、mp3等搜索。
能为您快速定制各类搜索引擎,如果您各类搜索引擎需求,请联系我们:020-22174900,QQ:46244150。
meiZiNick
2008-05-01
打赏
举报
回复
什么呀
使用ASP.NET
获取
当前登录的AD帐号 “
域
\用户名”
使用ASP.NET
获取
当前登录的AD帐号 “
域
\用户名”1 web.config 要加上这两个配置2 IIS 的访问权限配置 故事背景: 本人是要实现Windows登录后,就直接通过AD
获取
用户名,而不需要重新登录,所以网上找了很多案例,各种测试,都没有找到解决方案,后来经过了几天时间的研究探讨,各种百度代码测试,现在总结下大概要点。 1 在这里插入代码片 Response.Wri...
C#如何在WEB开发中
获取
当前登录
域
用户信息(通过LDAP)
C#如何在WEB开发中通过LDAP
获取
当前登录
域
用户信息,具体属性信息需结合
域
的配置,具体见以下代码: 前端页面适当位置显示用户名信息: <span class="h3"> <span>@LoginSession.LoginUser.DisplayName</span> </span> ...
微信公众号开发之微信
网页
授权
获取
用户个人信息
说明:该篇博客是博主一字一码编写的,实属不易,请尊重原创,谢谢大家! 一丶概述 微信
网页
授权 如果用户在微信客户端中访问第三方
网页
,公众号可以通过微信
网页
授权机制,来
获取
用户基本信息,进而实现业务逻辑。 现在,我们要实现一个微信内
网页
,通过微信访问
网页
时,
网页
会展示微信用户的个人信息。因为涉及到用户的个人信息,所以需要有用户授权才可以。当用户授权后,我们的
网页
服务器(开发者服务器)会...
如何
获取
微信用户的Openid详解(微信
网页
授权)
这篇文章是转载的,不要骂我。这个博客我就是自己整理材料,自己用的。请嘴下留情。 如果用户在微信客户端中访问第三方
网页
,公众号可以通过微信
网页
授权机制,来
获取
用户基本信息,进而实现业务逻辑。 关于
网页
授权回调
域
名的说明 1、在微信公众号请求用户
网页
授权之前,开发者需要先到公众平台官网中的“开发 - 接口权限 -
网页
服务 -
网页
帐号 -
网页
授权
获取
用户基本信息”的配置选项中,修改授权回调
域
...
java
获取
当前页面url地址_js如何准确
获取
当前页面url
网址
信息
在WEB开发中,时常会用到javascript来
获取
当前页面的url
网址
信息,在这里是我的一些
获取
url信息的小总结。下面我们举例一个URL,然后获得它的各个组成部分:http://i.cnblogs.com/EditPosts.aspx?opt=11、window.location.href(设置或
获取
整个 URL 为字符串)var test = window.location.href;ale...
搜索引擎技术
2,759
社区成员
2,049
社区内容
发帖
与我相关
我的任务
搜索引擎技术
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
复制链接
扫一扫
分享
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章