利用正则表达式批处理含链接内容文档下载

weixin_39821260 2019-09-18 07:01:04
由于项目需求,自己需要将带有链接的标签去除,例如
<a href="/zhaoyao/17-66.html">头晕</a>,转换后的文档为头晕。
由于说明书数量太大(100,569)自己需要采用批处理的方式进行操作。以后用户访问的就是批处理后的文档。故采用正则表达式的形式进行文档处理。
要读取文档内10w多条的数据,可按照3步走战略:
1.外层循环利用文件过滤器读取文件夹内所有符合条件的文件。
2.读取每一个筛选到的文件,利用正则表达式去除超链接符号。
3.将每一个处理过的文件重写回源文件。
相关下载链接://download.csdn.net/download/sunhuaqiang1/9311413?utm_source=bbsseo
...全文
浏览 点赞 收藏 回复
写回复
回复
切换为时间正序
请发表友善的回复…
发表回复

还没有回复,快来抢沙发~

发动态
发帖子
下载资源悬赏专区
创建于2007-03-31

8080

社区成员

CSDN 下载资源悬赏专区
申请成为版主
社区公告
暂无公告