求救 java解析html

liweiqiang132 2008-04-02 06:01:57
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.TableTag;
import org.htmlparser.util.NodeList;

public class ExtractTable {

static String html = " <html> <head> </head> <body>"
+ " <table> <tr> <td>hello table </td> </tr> </table> <table> <tr> <td>hello table <a href=http://www.baidu.com>tt </a> </td> </tr> </table> "
+ " </body> </html>";//这里是html的内容

//static String html = "http://www.baidu.com";

public static void test5(String resource) throws Exception {
Parser myParser = new Parser(resource);
// Parser parser = new Parser(content);
// 设置编码
myParser.setEncoding("utf-8");
//String filterStr = "table";//这里析取得是标签为table的元素
String filterStr="table";
NodeFilter filter = new TagNameFilter(filterStr);//过滤这个标签
NodeList nodeList = myParser.extractAllNodesThatMatch(filter);//抽取所有table列表
for (int i = 0; i < nodeList.size(); i++) {
TableTag tabletag = (TableTag) nodeList.elementAt(i);
System.out.println(tabletag.toHtml());//打印出来

}

}

/**
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
test5(html);//当然这里可以写成一个链接地址比如将html代替为"http://www.baidu.com"
}

}


在String filterStr="table";这里,我把filterStr改为filterStr="a";为什么报错了啊??
...全文
52 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
hmsuccess 2008-04-02
  • 打赏
  • 举报
回复
TableTag tabletag = (TableTag) nodeList.elementAt(i);

62,623

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧