提取html中的一部分文字信息

xbgordon 2007-09-16 01:37:48

import java.net.*;
import java.io.*;

class test
{
public static void main(String [] args) throws Exception
{

String result = "";
String url="http://dict.cn/search/?q=kiss";

try
{
String urlName = url;

URL U = new URL(urlName);

URLConnection connection = U.openConnection();
connection.connect();

BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));

String line;

while ((line = in.readLine())!= null)
{
result = line+"\r\n";
System.out.println(result);
}

in.close();
}
catch(Exception e)
{
System.out.println("没有结果！"+e);
}

}
}
上面是我写的读取http://dict.cn/search/?q=kiss的html的信息，我现在想获取网页中的文本信息（就是解释kiss的文本信息），HtmlParser我找了半天，不会用，还是算了!尝试了JDK 1.5的parser，但是不知道怎么输出文本信息。望高手指教，给我个例子（要能输出html中的文本信息的，网上好多都是没有输出的例子），最好直接改我的代码,

...全文

139 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

在EXCEL表格里，怎么提取某一单元格中的一部分文字首先在电脑桌面上打开EXCEL表格，Excel的A列中有如下数据，从中提取市名，例如A列中提劝青岛”到B列中。因为这些数据规律是非常固定的，所以可以用分列、快速填充等提取，这里用了mid函数，显示是从第3个字符开始，提取2个字符。如何提取Excel单元格中的部分数据?在Excel中可以用left函数从某单元格中左侧开始提取部分文字，用right...

默认记录上一次的xpath 方便多次提取自动模式下进入手动提取也会显示上次的xpath标题就是要提取的纯文本网址就是要提取的属性(自己看源码要提取东西为等号后面的直接就在xpath后面加@等号前面的单词例如href=“网址” 就写成@href >< 里面的内容直接就用标题提取看下面的例子)简单的xpath提取教程: 发现问题的请反馈一下右键复制...

在日常的学习和工作中，很多人都会需要到网上查找一些资料。当查找到我们需要的资料时，想要复制下来，可是网页上有限制，不允许复制粘贴。这时很多小伙伴就采取手动输入的方式了，如果资料不太多的话，手动输入的方式还可以接受。如果量比较大的话，手动输入就比较费劲了。今天小编教给大家3种方法，轻松提取网页文字哦。方法一：使用源代码复制很多小伙伴可能不知道怎样找到源代码，很简单，在需要复制文字网页的空白处点击鼠标...

python中提取html源代码中的内容 python如何获取需登录会员后复制文字的部分网页内容如何在jupyter中不换行输入 Non-UTF-8 code starting with '\xe7' in file .py on line, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details re正则库sub替换字符串 &ensp

//富文本编辑器内的内容保存到数据库后是一段html代码，先因某些需求需要去掉其中的样式等内容，只保留文字，代码如下：public class HtmlToText extends HTMLEditorKit.ParserCallback {private static HtmlToText html2Text = new HtmlToText();StringBuffer stringBuffe...

81,094

社区成员

341,711

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章