帮忙运行一下这个程序

hagbaby 2006-02-10 05:17:09
import org.htmlparser.Parser;
import org.htmlparser.visitors.TextExtractingVisitor;


public static void main(String[] args) throws Exception
{
Parser parser = new Parser("http://2008.sohu.com/20060210/n241768433.shtml");
TextExtractingVisitor visitor = new TextExtractingVisitor();
parser.visitAllNodesWith(visitor);
System.out.println(visitor.getExtractedText().trim());
}


运行结果里还有我不需要的东西,如:


td,input,select {font-size:12px;color:#000000;}

.ui_top{color:#000000;font-size:12px;line-height:18px;}
.ui_top a:link{color:#000000;text-decoration:none;}
.ui_top a:visited{color:#000000;text-decoration:none;}
.ui_top a:hover {color:#000000;text-decoration:underline;}
a.link,a.:visited {color: #0071AE;text-decoration:none;line-height:18px;}
a.:hover{text-decoration:underline;}


var clickCount = 0;
function clearCommentContent(oObject) {
clickCount++;
if (clickCount == 1) {
oObject.value = "";
}
}
function checkCommentContent(oObject) {
if (clickCount == 0)
alert("请先填写您的个人看法");
else if(checkInput() != false)
oObject.form.submit();
}


请问这是为什么?
...全文
140 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
hagbaby 2006-02-21
  • 打赏
  • 举报
回复
不好意思,好几天没看贴了。

对我就是不想输出javascript ,css 等代码
说白了就是想要一个网页中的正文部分。


谢谢
interpb 2006-02-14
  • 打赏
  • 举报
回复
你是不是不想在输出结果中
显示那些 javascript ,css
等代码
athlon0807 2006-02-14
  • 打赏
  • 举报
回复
请问你要找什么?
congliu 2006-02-11
  • 打赏
  • 举报
回复
请问具体有什么问题?

62,629

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧