Jsoup提取谷歌搜索结果

The_end90 2014-09-09 04:31:13
public static void main(String[] args) {
Document doc = null;
try{
doc = Jsoup.connect("https://www.google.com.hk/#newwindow=1&safe=strict&q=java")
.userAgent("Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.17 (KHTML, like Gecko)Chrome/24.0.1312.56 Safari/537.17")
.timeout(3000).get();
String body = doc.body().toString();
String title = doc.title().toString();
System.out.println(title+"=="+body);
} catch (IOException e) {
e.printStackTrace();
}
}

以上是我写的利用Jsoup获取谷歌搜索结果的代码,但是输出的title和body内容是www.google.com.hk首页的html代码,不是我要的搜索结果页面的html代码。有哪位大神知道原因吗?求解释一下,先谢谢了。
...全文
222 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
qingyuan18 2014-09-10
  • 打赏
  • 举报
回复
用google的搜索api,需要注册其开发key 你自己写代码去抓google的搜索结果很有可能会被谷歌后台程序查到当作机器爬虫处理的
  • 打赏
  • 举报
回复
引用 3 楼 w405112941 的回复:
[quote=引用 2 楼 lifeibuaa 的回复:] String body = doc.select("title").text(); String title = doc.select("body").text(); http://jsoup.org/cookbook/extracting-data/selector-syntax
这样拿到的还是首页的内容,不是搜索结果页面的内容[/quote] 我能问一下你是用哪种方式连上的Google吗
The_end90 2014-09-10
  • 打赏
  • 举报
回复
引用 2 楼 lifeibuaa 的回复:
String body = doc.select("title").text(); String title = doc.select("body").text(); http://jsoup.org/cookbook/extracting-data/selector-syntax
这样拿到的还是首页的内容,不是搜索结果页面的内容
The_end90 2014-09-10
  • 打赏
  • 举报
回复
引用 5 楼 qingyuan18 的回复:
用google的搜索api,需要注册其开发key 你自己写代码去抓google的搜索结果很有可能会被谷歌后台程序查到当作机器爬虫处理的
可不可以给点资源学习一下?
  • 打赏
  • 举报
回复
String body = doc.select("title").text();
String title = doc.select("body").text();



http://jsoup.org/cookbook/extracting-data/selector-syntax
The_end90 2014-09-09
  • 打赏
  • 举报
回复
没有人吗???自己顶一下,求大神啊。。。

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧