社区
Java SE
帖子详情
如何用正则表达式解析HTML
princeforest
2006-10-16 11:11:18
试图用Pattern从HTML中提取形如<a href="http://tech.tom.com/2006-07-16/04BI/08261701.html" target=_blank class=clink>科研经费提成合法不合理 多位大学校长呼吁改革</a><br>的字符串,
需要支持中文的提取,请问该如何编写相应的正则表达式?
...全文
344
5
打赏
收藏
如何用正则表达式解析HTML
试图用Pattern从HTML中提取形如科研经费提成合法不合理 多位大学校长呼吁改革的字符串, 需要支持中文的提取,请问该如何编写相应的正则表达式?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
zzhzzh204553
2006-11-15
打赏
举报
回复
你把标签去部去掉就可以啊.
<.*?>可以找出所有标签,替换成"",
剩下的就是文本了.
gzpoplar
2006-11-15
打赏
举报
回复
mark
lip009
2006-10-18
打赏
举报
回复
从HTML代码中提取连接地址:
<script>
var str="ksldfjk<a href='a.jsp'>aaa</a><a href='a.jsp'>aaa</a><a href='a.jsp'>aaa</a>";
var url=[];
var i=0;
str.replace(/<a\s+href=[\"']?([^<>\"']*)[\"']?>/g,function($0,$1){url[i]=$1;i++});
alert(url);
</script>
zh__ua
2006-10-18
打赏
举报
回复
<a\s+href=.+?>.+?</a>
princeforest
2006-10-18
打赏
举报
回复
<a href=([^>]*)>[\u4e00-\u9fa5]+</a>
常用
正则表达式
HTML
,JAVA合集
正则表达式
的合集,包括电话号码,邮箱验证,手机号码验证等等...开发时候拿来用非常方便!
精通
正则表达式
(第三版)简体中文版
精通
正则表达式
(第三版)简体中文版
java
正则表达式
提取
html
中的信息
java实现用
正则表达式
的方法提取
html
中的信息,可以提取标题,正文,链接等。经过运行,没问题的
源码(精通
正则表达式
&实战
正则表达式
)
javascript
正则表达式
视频教程 包含:精通
正则表达式
五部视频,实战
正则表达式
两部视频和源码压缩包
正则表达式
的妙用
刚学了下
正则表达式
,就做了个可以导出某种视频网站的视频地址(这样都不懂就不怪我了),导出来的视频可以在线观看。技术不是很牛,网站还算不错。
Java SE
62,624
社区成员
307,257
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章