社区
基础编程
帖子详情
关于各大搜索引擎关键词解码
abaowu
2005-06-28 02:08:35
经常看到像GOOGLE,百度的搜索关键以这样的方式编码
GOOGLE:
q=LG%E6%98%BE%E7%A4%BA%E5%99%A8%E6%9C%8D%E5%8A%A1%E7%94%B5
BAIDU:
wd=%C0%A5%D2%BB
原以为只是urlencode,但今天尝试下来,并不是.......
不知道,该如何将这些关键词还原
...全文
156
3
打赏
收藏
关于各大搜索引擎关键词解码
经常看到像GOOGLE,百度的搜索关键以这样的方式编码 GOOGLE: q=LG%E6%98%BE%E7%A4%BA%E5%99%A8%E6%9C%8D%E5%8A%A1%E7%94%B5 BAIDU: wd=%C0%A5%D2%BB 原以为只是urlencode,但今天尝试下来,并不是....... 不知道,该如何将这些关键词还原
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
abaowu
2005-06-28
打赏
举报
回复
$keywords = "LG%E6%98%BE%E7%A4%BA%E5%99%A8%E6%9C%8D%E5%8A%A1%E7%94%B5";
GOOGLE: iconv("UTF-8", "GB2312", rawurldecode($keywords));
GOOGLE、BAIDU暂时解决,
这样看来,只要了解当前搜索引擎的编码方式就可以了,基本上都没做过特别处理,BAIDU是GB2312的,所以在我的GB2312编码下不必再次转换了,而GOOGLE是UTF-8编码的,所以要转换成你当前所要的形式。
下面我会对
新浪搜索 Yahoo!中国 天网搜索 Excite WiseNut AltaVista
进行分析,是不是都是这样做的
xuzuning
2005-06-28
打赏
举报
回复
GOOGLE页面语言是utf-8的,所以其url参数用urlencode解码后也是utf-8编码的
$s = "LG%E6%98%BE%E7%A4%BA%E5%99%A8%E6%9C%8D%E5%8A%A1%E7%94%B5";
echo iconv("utf-8","gbk",urldecode($s)); //out LG显示器服务电
当然,google是面向全世界的。是否能简单的做编码转换,是要具体分析的
abaowu
2005-06-28
打赏
举报
回复
百度的可以通过urldecode()还原
[转]ASP实现
关键词
获取(各
搜索引擎
,GB2312及UTF-8)
不知道为什么现在
各大
搜索引擎
编码居然不一样.当然不是GB2312就是UTF-8了.编码问题是比较头疼的问题…头疼的不要命… 我们获得
关键词
,一般是通过来访页面的url进行分析的.比如 http://www.google.com/search?hl=zh-CN&q=孤独&lr= 各位肯定知道这个是通过urlencode编码的. 我们得到其中的信息,需要进行2步.第一步是进行urldecode,在我们普通参数活得的时候,这个是由ASP自己来进行的,但是现在我们不得不进行手工
解码
. 网上函数很多,但都是针对于GB2312页面解GB2312.UTF-8的.对于这个,我们
java asp分析各种
搜索引擎
的关键字,自动识别url 中关键字的编码
网上也有一些代码,大部分都是通过输入的关键字来识别编码,并
解码
。但是
搜索引擎
得到的referer来源地址上的关键字是通过URLencode编码过的,而且各个网站的关键字Urlencode编码都不一样,gbk,utf-8,gb2312等等。
深入解析百度
搜索引擎
:URL
解码
与
关键词
eqid的功能及含义
在网络信息化高度发达的当下,百度
搜索引擎
凭借其规模庞大,成为了中国最具影响力的搜索工具之一,满足了广大用户的各种信息检索需求。然而在使用这个搜索平台的过程中,很多用户可能会碰到一些特殊状况,例如搜索结果中的URL包含异常字符,或者
关键词
后紧跟的eqid参数等。
es学习笔记-
搜索引擎
基本概念
一.
搜索引擎
分类:全文、垂直 (1)全文
搜索引擎
应用于:NLP、爬虫、大数据处理、网页处理、大数据处理 代表:Google、百度 (2)垂直
搜索引擎
应用在有明确的搜索目的行为 代表:电商平台、OA、视频网站、地图网站
搜索引擎
的要求 (1)查询快 高效的压缩算法 快速的编码和
解码
速度 (2)搜索准 符合用户期待值高 评分算法:BM25,TF-IDF (3)检索结果丰富 召回率要求高 二.Lucene(全文
搜索引擎
) 目的:解决关系型数据库:性能差、不可靠、结果不准确(相关度低)等问题,实现
asp实现
关键词
获取(各
搜索引擎
,gb2312及utf-8).
不知道为什么现在
各大
搜索引擎
编码居然不一样.当然不是gb2312就是utf-8了.编码问题是比较头疼的问题...头疼的不要命...我们获得
关键词
,一般是通过来访页面的url进行分析的.比如http://www.google.com/search?hl=zh-CN&q=%E5%AD%A4%E7%8B%AC&lr=各位肯定知道这个是通过urlencode编码的.我们得到其中的信息,需要进行2步.第一步
基础编程
21,891
社区成员
140,342
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章