如何去除页面上除换行、段落的代码?

chinastorm 2007-03-15 02:44:00
我想去掉除了段落标记之外的所有html标记,只要页面的文字,好比是我把代码贴到记事本里面的效果,去掉了链接等代码。
正则或者asp程序都可以,谢谢!
...全文
1757 36 打赏 收藏 转发到动态 举报
写回复
用AI写文章
36 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
比较偷懒一点的做法就是先把段落标记替换为特殊字符(不能为hmtl标记),然后执行以下操作:可编辑<iframe>或<div>.innerhtml=替换后字符串,可编辑<iframe>或<div>.innerhml=可编辑<iframe>或<div>.innerText.最后将innerhtml中的特殊字符替换回来.绝对可用,但是效率可能不如正则高.我现在还在用这个方法,不会正则.希望高手给个正则表达式子,我也学习一下.
chinastorm 2007-03-20
  • 打赏
  • 举报
回复
给chinastorm顶一下.
记得我是谁吗?
-----------------------
哥们,有时间给你打电话!
pzhuyy 2007-03-16
  • 打赏
  • 举报
回复
mark.
阿非 2007-03-16
  • 打赏
  • 举报
回复
up
hjx398 2007-03-16
  • 打赏
  • 举报
回复
赌东道赌东道赌东道的
  • 打赏
  • 举报
回复
我的做法是使用户将输入输入到一个iframe中在提交之前用语句content=document.getElementById(<frameid>).innerText将输入副给一隐藏域
然后在提交这样客户端把事情都做了,不用做任何处理直接用就可以了.
但是一定要注意设置好iframe的disignMode属性
o07 2007-03-16
  • 打赏
  • 举报
回复
正则很不错
HELLO_JIM 2007-03-16
  • 打赏
  • 举报
回复
正则很不错,要系统的学习一下////////////////////////
文盲老顾 2007-03-16
  • 打赏
  • 举报
回复
mark
L18972934 2007-03-16
  • 打赏
  • 举报
回复
mark
AeroRoad 2007-03-16
  • 打赏
  • 举报
回复
正则真简单,要好好研究一下。
AeroRoad 2007-03-16
  • 打赏
  • 举报
回复
好啊
chinastorm 2007-03-16
  • 打赏
  • 举报
回复
已经测试完毕,用</?(?!br|p|BR|P)[^>]*>这样的正则就好了。
谢谢大家!
hymxtang 2007-03-16
  • 打赏
  • 举报
回复
学习~
hbhbhbhbhb1021 2007-03-16
  • 打赏
  • 举报
回复
起作用的,可以看下面的代码。
另外,楼主的段落是指<p>?
<script language=javascript>
var str="<a href=\"bbb\" >a</a><br><br> 正文 <br>1<div >dfsafas</div> 正文2 "
re=/(<(?!br|\/br))[^>]*?>/ig
alert(str.replace(re,""))
</script>
李睿_Lee 2007-03-16
  • 打赏
  • 举报
回复
晕死,<(?!BR)[^>]*?>是起作用的,原来是我用的软件里,设置成Unix网络的正则的,结果没有匹配的。我还以为不起作用呢。
oheray 2007-03-16
  • 打赏
  • 举报
回复
北京招聘
Asp.net(C#)开发工程师
1、计算机专业本科以上学历,有能力者不限制;
2、精通ASP.NET、C#、MSSQLServer等技术及相关开发工具;
3、熟练掌握UML建模,至少熟悉一种建模软件;
4、熟悉数据库操作,有面向对象基础。熟悉三层开发构架;
5、应聘者请附上曾开发的项目实例或说明;
6、有较强的合作、沟通能力,具有团队精神与团队合作经验

根据能力定薪金,具体待遇面议,保证不低于同行业水平.


Email:hr@sinohousing.com


工作地点:
北京望京科技园利泽中园或北京电子城科技园区 [靠近望京和酒仙桥地区]
BoyHaXin 2007-03-16
  • 打赏
  • 举报
回复
顶起来
showhome 2007-03-16
  • 打赏
  • 举报
回复
public static string DelHTML(string Htmlstring)//将HTML去除

{
#region
//删除脚本

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

//删除HTML

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<(.[^>]*)>","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"-->","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<!--.*","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

//Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<A>.*</A>","");

//Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<[a-zA-Z]*=\.[a-zA-Z]*\?[a-zA-Z]+=\d&\w=%[a-zA-Z]*|[A-Z0-9]","");



Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(quot|#34);","\"",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(amp|#38);","&",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(lt|#60);","<",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(gt|#62);",">",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(nbsp|#160);"," ",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(iexcl|#161);","\xa1",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(pound|#163);","\xa3",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"&(copy|#169);","\xa9",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring, @"&#(\d+);","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);


Htmlstring.Replace("<","");

Htmlstring.Replace(">","");

Htmlstring.Replace("\r\n","");

//Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
#endregion


return Htmlstring;

}


调用时传入原数据.返回的就是除去后的.
无爱大叔 2007-03-16
  • 打赏
  • 举报
回复
给chinastorm顶一下.
记得我是谁吗?
加载更多回复(16)

28,391

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧