解析html文件获得P标签的文本信息

澎湃社会 2014-04-16 01:20:37
我使用BufferedReader获得了页面的字符串,然后我想通过截取或者通过数据流来解析。可是我不知道具体步骤看了网上一些解析出A标签或者其它标签的。我是新手求具体damo谢谢了!
...全文
391 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
Kenzson 2014-04-16
  • 打赏
  • 举报
回复
方法调用的不对啊
/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the template in the editor.
 */
package test;

import java.io.IOException;
import java.util.logging.Level;
import java.util.logging.Logger;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 *
 * @author Administrator
 */
public class DecodeHtml {

    public static void main(String[] args) {
        try {
            Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
            //Element content = doc.getElementsByClass("gs_bluezi");
            try {
                Elements links = doc.getElementsByTag("p");
                for (Element link : links) {
                    String linkText = link.text();
                    System.out.println(linkText + "");
                }
            } catch (Exception e) {
// TODO: handle exception
            }
        } catch (IOException ex) {
            Logger.getLogger(DecodeHtml.class.getName()).log(Level.SEVERE, null, ex);
// TODO: handle exception
        }
    }
}
tony4geek 2014-04-16
  • 打赏
  • 举报
回复
公司上不了。有问题就发帖。
澎湃社会 2014-04-16
  • 打赏
  • 举报
回复
引用 7 楼 rui888 的回复:
	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
		Elements links = doc.select("p");
     	for (Element link : links) {
      	  String linkText = link.text();
      	  System.out.println(linkText+"");
      	}
解决了,谢谢你红领巾。加个QQ好友可以吗
tony4geek 2014-04-16
  • 打赏
  • 举报
回复
	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
		Elements links = doc.select("p");
     	for (Element link : links) {
      	  String linkText = link.text();
      	  System.out.println(linkText+"");
      	}
tony4geek 2014-04-16
  • 打赏
  • 举报
回复
澎湃社会 2014-04-16
  • 打赏
  • 举报
回复
引用 3 楼 awajwgluiawa 的回复:
引用 2 楼 u014633558 的回复:
引用 1 楼 rui888 的回复:
jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档
public static void main(String[] args) throws IOException { Document doc = Jsoup.parse("http://www.jtxx0551.com/hfwsslkiframe.action", "GDK"); //Element content = doc.getElementsByClass("gs_bluezi"); try { Elements links = doc.getElementsByTag("p"); for (Element link : links) { String linkText = link.text(); System.out.println(linkText+""); } } catch (Exception e) { // TODO: handle exception } }这是我根据列子写的怎么不行啊
tony4geek 2014-04-16
  • 打赏
  • 举报
回复
包下载下来拷贝进去 地址1 地址2
Kenzson 2014-04-16
  • 打赏
  • 举报
回复
引用 2 楼 u014633558 的回复:
引用 1 楼 rui888 的回复:
jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档
澎湃社会 2014-04-16
  • 打赏
  • 举报
回复
引用 1 楼 rui888 的回复:
jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
tony4geek 2014-04-16
  • 打赏
  • 举报
回复

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧