去掉html代码中的标签

yaotomo 2016-11-16 07:52:02
现在有个需求是在一个tab的每一栏里显示文章列表,格式如下


其中1是第一篇文章的标题,2是第一篇文章中的标题图片,3是第一篇文章的内容简介
4是其他文章的列表。

其中有几个问题想请教各位
1、数据库中content字段保存的是html代码,如果我在前台原样显示就会带出富文本的格式。只能用正则表达式去掉文章内容中的html标签。我在网上找过一些资料,但都多多少少保留着一些格式。请教有什么好的方法吗?
2、每篇文章的内容字段中包含自己的标题,要显示文章的内容不能把标题也显示出来,也没法区分标题和实际文章内容,没有什么办法解决吗?
...全文
391 8 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
gengchenhui 2016-11-21
  • 打赏
  • 举报
回复
引用 5 楼 yaotomo 的回复:
[quote=引用 4 楼 gengchenhui 的回复:] sp说了,你要找专业的HTML语法分析器。。。
也就是说,只能通过专业的语法分析器工具去实现,在自己的代码里不能实现吗?[/quote] 所谓“专业的语法分析器工具”不也就是自己代码跟别人代码的问题嘛,那有什么是“自己代码不能实现”的呢?关键在于一般人会简单的找一个正则表达式,不过sp的意思是正则不是推荐的方式而已
qq2460857094 2016-11-19
  • 打赏
  • 举报
回复
标题的话要看你的标题有什么规则,是不是都是<h2>,如果都是的话也好把它取出来。正文的话直接把所有的HTML都去掉就可以了。 像你这样的话,标题就应该用一个字段保存标题,一个字段保存简介,一个字段保存内容这样分开来的,而不是都保存在一个字段里面。
yaotomo 2016-11-16
  • 打赏
  • 举报
回复
要的就是下面这种效果
yaotomo 2016-11-16
  • 打赏
  • 举报
回复
引用 4 楼 gengchenhui 的回复:
sp说了,你要找专业的HTML语法分析器。。。
也就是说,只能通过专业的语法分析器工具去实现,在自己的代码里不能实现吗?
gengchenhui 2016-11-16
  • 打赏
  • 举报
回复
引用 3 楼 yaotomo 的回复:
[quote=引用 1 楼 sp1234 的回复:] 识别一个表达式的语法的机制,叫做“语法分析器”。并不是去简单地匹配词法。有些人动不动就纠结“正则”,那是因为没有学好基本的编译原理。
请教前辈,具体应该怎么做呢? 比如说下面一段html代码

<p>
	<br />
</p>
<h2 style="text-align:center;">
	利用天敌防治槟榔害虫的研究及应用推广<span></span> 
</h2>
<p class="MsoNormal" align="right" style="text-align:right;background:white;">
	来源::海南南药园
</p>
<p class="MsoNormal" style="background:white;">
	        槟榔是海南最大宗药材,也是海南第二大经济作物,红脉穗螟是槟榔种植上最重要的害虫,危害槟榔花和果,发生普遍,危害率为16%以上,年损失4亿元以上,化学农药防治该害虫存在树高不易喷药、浓度低效果不佳、化学残留、药效持续时间短、污染环境等问题,对海南生态环境造成很大破坏。<br />
        通过调查研究发现了红脉穗螟的寄生性天敌——扁股小蜂,经查新为国内外首次发现,确定为中国新记录昆虫种类,通过室内及田间试验发现该寄生蜂对害虫寄生率高、产卵量大,防治效果非常好,研究出寄主人工饲料,为寄生蜂批量繁殖提供了原料和技术的保障,申请国家专利并获授权。在三亚建立了以生物防治为主的无公害综合防治技术示范基地,经过连续释放寄生蜂,完全控制害虫发展危害,无需施药,减少损失30%以上,该技术施用防治成本只有化学防治成本的21%左右。全省共建立红脉穗螟防治示范基地3个,面积400多亩。已技术推广面积6000多亩,每亩增收280-380元,共挽回经济损失200万元左右,取得良好经济和社会效益。经海南省科技厅组织的专家鉴定,一致认为该成果为槟榔重大害虫防治提供了安全有效的新技术,对保护海南生态环境和促进南药的规范化生产均具有实际意义, 成果整体水平达到国内领先水平。该成果获海南省2012年科技进步二等奖。
</p>
<p>
	<br />
</p>
<p>
	<img src="/e/upload/s1/fck/image/2016/11/02/2003400254.png" alt="" /><img src="/e/upload/s1/fck/image/2016/11/02/2003535351.png" alt="" /> 
</p>
[/quote] sp说了,你要找专业的HTML语法分析器。。。
yaotomo 2016-11-16
  • 打赏
  • 举报
回复
引用 1 楼 sp1234 的回复:
识别一个表达式的语法的机制,叫做“语法分析器”。并不是去简单地匹配词法。有些人动不动就纠结“正则”,那是因为没有学好基本的编译原理。
请教前辈,具体应该怎么做呢? 比如说下面一段html代码

<p>
	<br />
</p>
<h2 style="text-align:center;">
	利用天敌防治槟榔害虫的研究及应用推广<span></span> 
</h2>
<p class="MsoNormal" align="right" style="text-align:right;background:white;">
	来源::海南南药园
</p>
<p class="MsoNormal" style="background:white;">
	        槟榔是海南最大宗药材,也是海南第二大经济作物,红脉穗螟是槟榔种植上最重要的害虫,危害槟榔花和果,发生普遍,危害率为16%以上,年损失4亿元以上,化学农药防治该害虫存在树高不易喷药、浓度低效果不佳、化学残留、药效持续时间短、污染环境等问题,对海南生态环境造成很大破坏。<br />
        通过调查研究发现了红脉穗螟的寄生性天敌——扁股小蜂,经查新为国内外首次发现,确定为中国新记录昆虫种类,通过室内及田间试验发现该寄生蜂对害虫寄生率高、产卵量大,防治效果非常好,研究出寄主人工饲料,为寄生蜂批量繁殖提供了原料和技术的保障,申请国家专利并获授权。在三亚建立了以生物防治为主的无公害综合防治技术示范基地,经过连续释放寄生蜂,完全控制害虫发展危害,无需施药,减少损失30%以上,该技术施用防治成本只有化学防治成本的21%左右。全省共建立红脉穗螟防治示范基地3个,面积400多亩。已技术推广面积6000多亩,每亩增收280-380元,共挽回经济损失200万元左右,取得良好经济和社会效益。经海南省科技厅组织的专家鉴定,一致认为该成果为槟榔重大害虫防治提供了安全有效的新技术,对保护海南生态环境和促进南药的规范化生产均具有实际意义, 成果整体水平达到国内领先水平。该成果获海南省2012年科技进步二等奖。
</p>
<p>
	<br />
</p>
<p>
	<img src="/e/upload/s1/fck/image/2016/11/02/2003400254.png" alt="" /><img src="/e/upload/s1/fck/image/2016/11/02/2003535351.png" alt="" /> 
</p>
  • 打赏
  • 举报
回复
识别一个表达式的语法的机制,叫做“语法分析器”。并不是去简单地匹配词法。有些人动不动就纠结“正则”,那是因为没有学好基本的编译原理。 比如说
<x id="asdfkad" exp="y>x"> hello<def>82834 abc def</def></x> 
要理解这种随时可能增加exp等等属性、随时调整位置、随时改变属性值的表达式,必须使用“语法分析器”来获得语法结构。 而不是什么“正则”。纠结正则的做法,我们知道它是“写死的”而不是靠谱的、长不了的。

62,242

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧