java 正则表达式提取页面代码问题。。。
要提取下面网页中的
1。title部分。
2。<div id="movie_detail_infor">到<!-- google_ad_section_end -->中间部分。
<html xmlns="http://www.w3.org/1999/xhtml"><head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>
还有一个值得向动作游戏高手们推荐的系统要素</title>
</head>
<body>
<div id="movie_detail_infor">
<div id="footer">
? (网站试运行),现阶段我们提供电影,电影游戏等内容的下载
</div>
</div>
<!-- google_ad_section_end -->
</body></html>
下面是我的代码。就是取不到。
public static void getMainContens(String alls) {
String patternStr = "<div id=\"movie_detail_infor\">" +
"(.*?)" +
"<!-- google_ad_section_end -->";
Pattern pa = Pattern.compile(patternStr);
Matcher m = pa.matcher(alls);
while (m.find()) {
System.out.println(m.group(1));
}
}
请高手帮忙。