新手求教htmlparser 简单问题

flashicp 2007-10-01 08:13:00
要获取的HTML原始字符如下
<div class="Left">
<span class="red">基本信息</span><br>

¡¤<span class="dark">
开本:</span>
16<br >

¡¤<span class="dark">
出版日期:</span>
2007-06<br >

¡¤<span class="dark">
版次:</span>
2007年6月第1版<br >

¡¤<span class="dark">
页数:</span>
653<br >

¡¤<span class="dark">
ISBN:</span>
9787500837909<br >

¡¤<span class="dark">
国别:</span>
中国大陆<br >

¡¤<span class="dark">
出版社:</span>
中国工人出版社<br >

¡¤<span class="dark">
精简装:</span>
平装<br >

</div>
要获取的内容如下
ISBN号
出版社号等各个信息
我用了正则的方式可是为什么获取不到呢
下面是我的代码
RegexFilter regFilter=new RegexFilter("ISBN:(.|\\n)+?<br\\s+>");
Parser isbnP=new Parser(nlist.toHtml().toString());
//System.out.println(isbnP.parse(Isbn).toHtml().toString());
System.out.println(isbnP.extractAllNodesThatMatch(regFilter).toHtml());
JAVA中正则要注意什么事件呢,难道是我的正则错了么
...全文
182 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
RegexFilter regFilter=
new RegexFilter("(([Ii][Ss][Bb][Nn]:.*?)|((出版社).*?))");
flashicp 2007-10-01
  • 打赏
  • 举报
回复
还没解决不知道那里错了是正则那里就是找不到具体的错误

67,512

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧