简单问题过滤Html

lubingli2007 2008-09-03 08:21:14
现从数据库读取了一个字段的数据但是有Html代码。于是在网上找了个过滤Html代码过滤。过滤了很多但是还是会出现这样的代码 <P class=MsoNormal style="MARGIN: 0cm 0cm 0pt; TEXT-ALIGN: center" 在网上找的过滤Html代码如下
public string NoHTML(string Htmlstring) //去除HTML标记
{
//删除脚本
Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");
Htmlstring.Replace(">", "");
Htmlstring.Replace("\r\n", "");
Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;
}
...全文
184 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
fdsahkg 2008-09-04
  • 打赏
  • 举报
回复
78945600
winner2050 2008-09-04
  • 打赏
  • 举报
回复
-_-! 你給我寄的是什么网页.

我根本搜索不到<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt; TEXT-ALIGN: center"
我连MsoNormal 都搜索不到.

-_-!
coli5ie 2008-09-03
  • 打赏
  • 举报
回复
cms里面的经常用到这个
cteddy 2008-09-03
  • 打赏
  • 举报
回复
楼主的意思是要删除
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt; TEXT-ALIGN: center"
这整句《p》标签是吧
不仅仅是把</>这些改变
lubingli2007 2008-09-03
  • 打赏
  • 举报
回复
你好winner2050 已经发到你的邮箱
winner2050 2008-09-03
  • 打赏
  • 举报
回复
你把整篇完整的html用txt邮寄到winner2050@126.com 給我看看
lubingli2007 2008-09-03
  • 打赏
  • 举报
回复
确定执行了。以为没有执行前是有很多HTML的用了之后少了很多。但是还是出现了一些
zftow110 2008-09-03
  • 打赏
  • 举报
回复
标记一下!
benbenkui 2008-09-03
  • 打赏
  • 举报
回复
我用的也是这个
编程有钱人了 2008-09-03
  • 打赏
  • 举报
回复
可以的
winner2050 2008-09-03
  • 打赏
  • 举报
回复
-_-! 这个就是我写的.
我网站用了很多年了没有发现漏掉过滤.
你确定你执行了这个代码??

62,266

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧