社区
ASP
帖子详情
关于ASP正则表达式。提取html中的文本内容
Richai
2017-12-25 09:03:42
最近有个很操蛋的项目。拿不到数据库。于是用网站下载软件把整站下载下来。全是静态页面。现在要把文章内容页通过正则表达把内容提取出来入库。网上试了很多正则表达式都不行。直接上图。求大神帮我看下。我ASP学的不是很好。
每篇文章都是从 <a style=font-size:12pt;FONT-FAMILY="仿宋_GB2312";line-height=150%><br> 这种标签开始到<div align="right">这个标签结束
...全文
1368
5
打赏
收藏
关于ASP正则表达式。提取html中的文本内容
最近有个很操蛋的项目。拿不到数据库。于是用网站下载软件把整站下载下来。全是静态页面。现在要把文章内容页通过正则表达把内容提取出来入库。网上试了很多正则表达式都不行。直接上图。求大神帮我看下。我ASP学的不是很好。 每篇文章都是从 这种标签开始到这个标签结束
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
太阳风暴1985
2018-02-18
打赏
举报
回复
查找到唯一性就可以了啊。
hookee
2018-02-17
打赏
举报
回复
把 <a style=font-size:12pt;FONT-FAMILY="仿宋_GB2312";line-height=150%><br>和<div align="right"> 先用replace() 换成简单的字符 比如my_start my_end,然后写正则就简单了。
Richai
2017-12-25
打赏
举报
回复
在上传一个文字稍微多一点的把。因为对方要求保密。所以就马赛克了。麻烦大神帮我看看。
Richai
2017-12-25
打赏
举报
回复
自己顶下。
。祈祷大神看到
Richai
2017-12-25
打赏
举报
回复
这是代码。然后注释掉的是我获取的标题。是可以获取到的。就是不能获取文章内容。求大神帮我看看。有什么办法能获取到正文。小弟感激不尽!
精通
正则表达式
基于.NET
ASP
PHP JSP JavaScript
RegexApplication/Default.
asp
x
正则表达式
类的应用 RegexApplication/GetPage
Html
Data.
asp
x 获取网页的
内容
第10章(/10/)
ASP
NETValidator/Compare.
asp
x 比较验证
ASP
NETValidator/...
18.C#字符串和
正则表达式
参考手册 影印版
6.2 在
正则表达式
中
作决策 168 6.3 在
正则表达式
内设定选项 171 6.4
正则表达式
引擎的规则 171 6.5 小结 173 第7章
正则表达式
模式 174 7.1 验证字符 174 7.2 验证数字 175 7.2.1 只包含数字 175 7.2.2 只包含整型数...
面向对象C#初级入门精讲
本套餐面向对象C#零基础入门精讲系列课程包括以下课程。课程1C#开发入门,课程2: C#语言基础,课程3:C#编程基础,课程4:面向对象基础,课程5:面向对象,课程6:WinForm基础,课程7:C#常用类,课程8:文件操作,课程9:集合,课程10:
正则表达式
及应用。专题标签:C#面向对象, C#,文件操作,正则,
正则表达式
。课程定位:抓住精髓 实例精讲 分析透彻 通俗易懂,为.NET开发奠定坚实基础
正则表达式
对
正则表达式
中
前一子表达式的引用所指定的并不是那个子表达式的模式,而是与那个模式相匹配的
文本
.这样,引用就不只是帮助你输入
正则表达式
的重复部分的快 捷方式了,它还实施了一条规约,那就是一个字符串各个分离的...
ASP
.NET使用
正则表达式
屏蔽垃圾信息
Regex 类 表示不可变的
正则表达式
。 命名空间:System.Text.Regular...因 此,在过度地依赖一组固定的
正则表达式
来
提取
、修改或验证
文本
的应用程序
中
,您可能更愿意调用这些静态 方法,而不是其相应的实例方法
ASP
28,390
社区成员
357,068
社区内容
发帖
与我相关
我的任务
ASP
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
复制链接
扫一扫
分享
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章