急求:正则过滤WORD转换成的HTML的标签

kidfang 2007-09-20 06:30:06
用户发新闻时经常粘贴word里的东西,HTML代码见最下面
新闻列表页要取这样的内容的前200个字,如何过滤.从网上搜的只能过滤一般的html标签,不能过滤如
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />这样的,
截取前200个字符时可能会形成断位,如下也要过滤掉
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office
这会导致新闻列表页表格混乱等.时间急,请大师们帮忙!


<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt><SPAN style="FONT-SIZE: 9pt; FONT-FAMILY: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt">浸四氟苎麻盘根、高水基盘根、高档油浸棉纱盘根、普通油浸棉纱盘根、<SPAN lang=EN-US><?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p></SPAN></SPAN></P> <P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN style="FONT-SIZE: 9pt; FONT-FAMILY: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt">纤维类盘根应用广泛,<SPAN lang=EN-US> </SPAN>根据各自不同的优良性能可用于</SPAN
...全文
334 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
wangqiuping1986 2007-09-27
  • 打赏
  • 举报
回复
哇 强人好多
liuyun1987 2007-09-27
  • 打赏
  • 举报
回复
或用>[^<]*?<可以取到HTML之间的内容
liuyun1987 2007-09-27
  • 打赏
  • 举报
回复
用这个正则<[^<]*>可以找到所有有HTML标签,你只要把它过滤掉行就行..
keystudio 2007-09-27
  • 打赏
  • 举报
回复
html = Regex.Replace(html, @"(^[^<>]*>)|(<[^<>]*$)", "", RegexOptions.IgnoreCase);

过滤半个标签
guitarbar 2007-09-27
  • 打赏
  • 举报
回复
ps.PIntro = ps.PIntro.Replace("</P>","</br>");


或者这样,把其他都过滤,就留个br,你先试试

ps.pintro 是我的字段 名
guitarbar 2007-09-27
  • 打赏
  • 举报
回复
string s = ps.PIntro.ToString();
string strhtml = Regex.Replace(s, "<.+?>", "");
strhtml = Regex.Replace(strhtml, "<br>", "
",RegexOptions.IgnoreCase);
ps.PIntro = ps.PIntro.Replace(s, strhtml);
ps.PIntro = ps.PIntro.Replace("'", "''");
ps.PIntro = ps.PIntro.Replace(" ", "");
ps.PIntro = ps.PIntro.Replace("& ldquo;", "");
ps.PIntro = ps.PIntro.Replace("& rdquo;", "");
nextsun 2007-09-20
  • 打赏
  • 举报
回复
中秋快乐!!!
ke5315309 2007-09-20
  • 打赏
  • 举报
回复
up 我也想知道哦

火星求索 2007-09-20
  • 打赏
  • 举报
回复
接分的中秋,一块

62,254

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧