请教一个java正则表达式的问题。
我想提取百度文库的一篇文档的信息:文档名字,上传者和下载量。
查找了网页源代码之后,得到的字符串,然后我定义变量。
private static final String TITLE ="<p class="reader-word-layer reader-word-s1-4" style="width:5182px;height:273px;line-height:273px;top:1279px;left:2488px;z-index:1;letter-spacing:5.26px;false">年普通高等学校招生全国统一考试(江西卷)</p>";
private static final String AUTHOR ="<a target="_blank" class="user log-xsend " data-logxsend= "[1,100593] " href="/ u/in_way?from=wenku">in_way</a> ==$0";
private static final String COUNT ="<span class= "ic ic-down-num"></span>"1242"";
我想提取“年普通高等学校招生全国统一考试(江西卷)”,“in_way”,“1242”这三个,可是我正则表达式看不懂。
不会写这三个正则表达式,求高手指点,谢谢了。
举例:读取一本书的书名,<meta name=”og:novel:book_name” content=”被风吹过的夏天”/>
那么就可以private static final String NAME="<meta name=\"og:novel:book_name\" content=\"(.*?)\"/> ";
通过一个getName方法,就可以获得书名。