社区
Java SE
帖子详情
如何用正则表达式解析HTML
princeforest
2006-10-16 11:11:18
试图用Pattern从HTML中提取形如<a href="http://tech.tom.com/2006-07-16/04BI/08261701.html" target=_blank class=clink>科研经费提成合法不合理 多位大学校长呼吁改革</a><br>的字符串,
需要支持中文的提取,请问该如何编写相应的正则表达式?
...全文
319
5
打赏
收藏
如何用正则表达式解析HTML
试图用Pattern从HTML中提取形如科研经费提成合法不合理 多位大学校长呼吁改革的字符串, 需要支持中文的提取,请问该如何编写相应的正则表达式?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
zzhzzh204553
2006-11-15
打赏
举报
回复
你把标签去部去掉就可以啊.
<.*?>可以找出所有标签,替换成"",
剩下的就是文本了.
gzpoplar
2006-11-15
打赏
举报
回复
mark
lip009
2006-10-18
打赏
举报
回复
从HTML代码中提取连接地址:
<script>
var str="ksldfjk<a href='a.jsp'>aaa</a><a href='a.jsp'>aaa</a><a href='a.jsp'>aaa</a>";
var url=[];
var i=0;
str.replace(/<a\s+href=[\"']?([^<>\"']*)[\"']?>/g,function($0,$1){url[i]=$1;i++});
alert(url);
</script>
zh__ua
2006-10-18
打赏
举报
回复
<a\s+href=.+?>.+?</a>
princeforest
2006-10-18
打赏
举报
回复
<a href=([^>]*)>[\u4e00-\u9fa5]+</a>
常用
正则表达式
HTML
,JAVA合集
在这个“常用
正则表达式
HTML
,JAVA合集”中,我们主要关注的是
HTML
和Java环境下的
正则表达式
应用。 1. **
HTML
中的
正则表达式
**: 在
HTML
中,
正则表达式
通常用于表单验证,例如输入字段(如邮箱、电话号码、手机号码...
精通
正则表达式
(第三版)简体中文版
例如,通过构建复杂的
正则表达式
来
解析
HTML
文档,从中抽取特定的链接地址或文本内容;利用
正则表达式
来进行邮件地址的有效性检查等。 #### 七、总结 《精通
正则表达式
(第三版)简体中文版》是一本全面介绍正则...
java
正则表达式
提取
html
中的信息
java实现用
正则表达式
的方法提取
html
中的信息,可以提取标题,正文,链接等。经过运行,没问题的
源码(精通
正则表达式
&实战
正则表达式
)
此外,JavaScript提供了`test()`、`match()`、`replace()`、`search()`和`split()`等方法,与
正则表达式
配合使用,完成各种字符串操作。 总之,通过这个资源,学习者不仅可以系统地学习
正则表达式
的理论知识,还能...
正则表达式
的妙用
这展示了一个具体的例子,即如何利用
正则表达式
解析
网页内容,抓取隐藏在
HTML
代码中的特定信息。
正则表达式
的核心在于其模式匹配能力。它由一系列字符、特殊符号和操作符组成,可以匹配各种复杂的数据格式。例如,...
Java SE
62,635
社区成员
307,269
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章