求一HTML标签正则

c02645 2013-03-28 11:12:25
想替换掉所有html标签,但<br>、<br />、<p>、</p>保留
...全文
161 5 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
EnForGrass 2013-03-28
  • 打赏
  • 举报
回复
引用 4 楼 c02645 的回复:
3楼的可以,2楼的不行
匹配什么不行
c02645 2013-03-28
  • 打赏
  • 举报
回复
3楼的可以,2楼的不行
md5e 2013-03-28
  • 打赏
  • 举报
回复

        /// <summary>
        /// 从HTML中获取文本,保留br,p,img
        /// </summary>
        /// <param name="HTML"></param>
        /// <returns></returns>
        public static string GetTextFromHTML(string HTML)
        {
            System.Text.RegularExpressions.Regex regEx = new System.Text.RegularExpressions.Regex(@"</?(?!br|/?p|img)[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

            return regEx.Replace(HTML, "");
        }
EnForGrass 2013-03-28
  • 打赏
  • 举报
回复
string s="yourhtml"; s=Regex.Replace(s,"(?is)<((?!(br|p))\w*)[^>]*?>.*?</\1>","");
EnForGrass 2013-03-28
  • 打赏
  • 举报
回复
(?is)<((?!(br|p))\w*)[^>]*?>.*?</\1>

111,092

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • AIGC Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧