请教一个java正则表达式的问题。

kk3239226441 2017-12-19 02:42:25
我想提取百度文库的一篇文档的信息:文档名字,上传者和下载量。
查找了网页源代码之后,得到的字符串,然后我定义变量。
private static final String TITLE ="<p class="reader-word-layer reader-word-s1-4" style="width:5182px;height:273px;line-height:273px;top:1279px;left:2488px;z-index:1;letter-spacing:5.26px;false">年普通高等学校招生全国统一考试(江西卷)</p>";

private static final String AUTHOR ="<a target="_blank" class="user log-xsend " data-logxsend= "[1,100593] " href="/ u/in_way?from=wenku">in_way</a> ==$0";

private static final String COUNT ="<span class= "ic ic-down-num"></span>"1242"";
我想提取“年普通高等学校招生全国统一考试(江西卷)”,“in_way”,“1242”这三个,可是我正则表达式看不懂。
不会写这三个正则表达式,求高手指点,谢谢了。

举例:读取一本书的书名,<meta name=”og:novel:book_name” content=”被风吹过的夏天”/>
那么就可以private static final String NAME="<meta name=\"og:novel:book_name\" content=\"(.*?)\"/> ";
通过一个getName方法,就可以获得书名。
...全文
140 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
kk3239226441 2017-12-22
  • 打赏
  • 举报
回复
引用 1 楼 hjgzj 的回复:
用jsoup试试吧,专门在java里解析html代码,跟jquery一样的用法。http://blog.csdn.net/hjgzj/article/details/78742888
多谢,已经解决了。
  • 打赏
  • 举报
回复
用jsoup试试吧,专门在java里解析html代码,跟jquery一样的用法。http://blog.csdn.net/hjgzj/article/details/78742888

50,550

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧