提取html中的一部分文字信息
import java.net.*;
import java.io.*;
class test
{
public static void main(String [] args) throws Exception
{
String result = "";
String url="http://dict.cn/search/?q=kiss";
try
{
String urlName = url;
URL U = new URL(urlName);
URLConnection connection = U.openConnection();
connection.connect();
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String line;
while ((line = in.readLine())!= null)
{
result = line+"\r\n";
System.out.println(result);
}
in.close();
}
catch(Exception e)
{
System.out.println("没有结果!"+e);
}
}
}
上面是我写的读取http://dict.cn/search/?q=kiss的html的信息,我现在想获取网页中的文本信息(就是解释kiss的文本信息),HtmlParser我找了半天,不会用,还是算了!尝试了JDK 1.5的parser,但是不知道怎么输出文本信息。望高手指教,给我个例子(要能输出html中的文本信息的,网上好多都是没有输出的例子),最好直接改我的代码,