关于ASP正则表达式。提取html中的文本内容

Richai 2017-12-25 09:03:42
最近有个很操蛋的项目。拿不到数据库。于是用网站下载软件把整站下载下来。全是静态页面。现在要把文章内容页通过正则表达把内容提取出来入库。网上试了很多正则表达式都不行。直接上图。求大神帮我看下。我ASP学的不是很好。

每篇文章都是从 <a style=font-size:12pt;FONT-FAMILY="仿宋_GB2312";line-height=150%><br> 这种标签开始到<div align="right">这个标签结束
...全文
1368 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
太阳风暴1985 2018-02-18
  • 打赏
  • 举报
回复
查找到唯一性就可以了啊。
hookee 2018-02-17
  • 打赏
  • 举报
回复
把 <a style=font-size:12pt;FONT-FAMILY="仿宋_GB2312";line-height=150%><br>和<div align="right"> 先用replace() 换成简单的字符 比如my_start my_end,然后写正则就简单了。
Richai 2017-12-25
  • 打赏
  • 举报
回复
在上传一个文字稍微多一点的把。因为对方要求保密。所以就马赛克了。麻烦大神帮我看看。
Richai 2017-12-25
  • 打赏
  • 举报
回复
自己顶下。。祈祷大神看到
Richai 2017-12-25
  • 打赏
  • 举报
回复

这是代码。然后注释掉的是我获取的标题。是可以获取到的。就是不能获取文章内容。求大神帮我看看。有什么办法能获取到正文。小弟感激不尽!

28,390

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧