java 正则表达式提取页面代码问题。。。

txzgavin334diuje 2010-01-22 03:48:02
要提取下面网页中的
1。title部分。
2。<div id="movie_detail_infor">到<!-- google_ad_section_end -->中间部分。


<html xmlns="http://www.w3.org/1999/xhtml"><head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>
还有一个值得向动作游戏高手们推荐的系统要素</title>
</head>
<body>
<div id="movie_detail_infor">
<div id="footer">
? (网站试运行),现阶段我们提供电影,电影游戏等内容的下载

</div>
</div>
<!-- google_ad_section_end -->
</body></html>



下面是我的代码。就是取不到。


public static void getMainContens(String alls) {

String patternStr = "<div id=\"movie_detail_infor\">" +
"(.*?)" +
"<!-- google_ad_section_end -->";

Pattern pa = Pattern.compile(patternStr);
Matcher m = pa.matcher(alls);

while (m.find()) {
System.out.println(m.group(1));
}
}


请高手帮忙。
...全文
72 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
keepkey 2010-01-23
  • 打赏
  • 举报
回复
建议楼主用I/O方法取,一行一行的,用indexOf()判断


我前几天给朋友下载《盗墓笔记》,没有找到现成的TXT,我就拿迅雷下载的网页全部链接,然后按固定格式分析HTML,批量转换为TXT
吴冬冬 2010-01-22
  • 打赏
  • 举报
回复
htmlparser
内容概要:本文介绍了基于MATLAB实现的PSO-KNN多特征分类预测项目,通过将粒子群优化算法(PSO)与K近邻算法(KNN)相结合,解决传统KNN在高维多特征数据分类中面临的参数敏感、特征冗余、分类精度低等问题。项目采用PSO对KNN的关键参数(如K值和特征权重)进行全局寻优,结合数据预处理、特征加权选择、适应度评估与并行化机制,构建了一个高效、自适应的智能分类模型。文中详细阐述了模型架构的各个层级,包括数据预处理、特征加权、参数寻优、粒子群协作策略及分类输出,并提供了部分MATLAB代码示例,涵盖主成分分析、粒子初始化、速度更新、交叉验证与结果可视化等关键步骤。; 适合人群:具备一定机器学习基础和MATLAB编程能力,从事数据分析、智能算法研究或工程应用的研发人员、高校研究生及科研工作者,尤其适合关注智能优化与分类预测融合应用的人员。; 使用场景及目标:①应用于医学诊断、金融风控、工业监测等需要高精度多特征分类的领域;②解决KNN算法在高维数据中的参数选择与特征权重优化难题;③提升分类模型的自动化程度与泛化能力,减少人工调参成本;④为智能算法集成与实际工程落地提供可复用的技术框架。; 阅读建议:此资源以实际项目为导向,结合理论与代码实现,建议读者在理解算法原理的基础上,运行并调试所提供的MATLAB代码,重点关注PSO寻优过程与KNN分类的耦合机制,同时可根据自身数据特点调整适应度函数与参数范围,实现模型迁移与优化。

51,412

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧