求!去掉html标签的正则表达式

wis2007 2008-08-29 01:13:59
我要的效果是只显示html页面显示的内容
<script language="javascript">
var htm;
var fso
function nohtml(str)
{
var re=new RegExp;
re.IgnoreCase =true;
re.Global=true ;
re.Pattern="(\<.[^\<]*\>)"
str=re.replace(str," ");
re.Pattern="(\<\/[^\<]*\>)"
str=re.replace(str," ")
nohtml=str
}
</script>
nohtml不能用,麻烦哪位大哥帮我实现这个功能
html代码
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-html401-19991224/loose.dtd">
<!-- saved from url=(0056)http://news.sina.com.cn/pl/2008-08-26/082316174130.shtml -->
<!--[1,1,16174130] published at 2008-08-26 08:23:02 from #194 by 2126--><!--大洋网-广州日报--><!--<a href="http://news.2008.sina.com.cn/z/focusOlympic/index.shtml" target=_blank>聚焦奥运</a>--><HTML
xmlns="http://www.w3.org/1999/xhtml"><HEAD><TITLE>吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网</TITLE>
<SCRIPT src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/sinaflash.js"
type=text/javascript></SCRIPT>
<SCRIPT src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/sinaflash.js"
type=text/javascript></SCRIPT>
<SCRIPT type=text/javascript>
//========================= 处理页面广告内容 end =============
<!-- GLADNEWS_END -->
<DIV id=page><A class=linkQuickJump
href="http://news.sina.com.cn/pl/2008-08-26/082316174130.shtml#blkBreadcrumb"><IMG
height=1 alt=跳转到路径导航栏 src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/c.gif"
width=1></A> <!-- 顶部导航 begin -->
<DIV class=topNav>
<DIV class=hd_nav id=content_mainNav>
<UL>
<LI id=content_mainNav_uniprolink><A href="https://login.sina.com.cn/">通行证</A>
</LI>
<LI id=content_mainNav_log><SPAN id=content_mainNav_uniproquit
style="DISPLAY: none"><A id=content_mainNav_userQuitBtn
href="javascript:void(0);">退出</A></SPAN> <SPAN id=content_mainNav_uq_username
style="DISPLAY: none"></SPAN></LI></UL></DIV></DIV><!-- 顶部导航 end --><!-- 顶通 begin --><!-- 顶通广告 begin -->
<TABLE class=adNone id=PublicRelation1 cellSpacing=0 cellPadding=0 width=950
border=0>
<TBODY>
<TR><!-- 顶通广告 尺寸750x90 start -->
<TD width=750>
<TABLE cellSpacing=0 cellPadding=0 width=750 border=0>
<TBODY>
<TR>
<TD align=middle><IFRAME marginWidth=0 marginHeight=0
src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/17251.htm" frameBorder=0
width=750 scrolling=no height=90></IFRAME></TD></TR></TBODY></TABLE></TD><!-- 顶通广告 尺寸750x90 end -->
<TD width=8></TD><!-- 今日导读 尺寸189x90 start -->
<TD class=starSearchBLK
style="BORDER-RIGHT: #dedede 1px solid; BORDER-TOP: #dedede 1px; BACKGROUND: #fff; BORDER-LEFT: #dedede 1px solid; BORDER-BOTTOM: #dedede 1px solid"
vAlign=top align=middle width=190><!-- 今日导读 begin --><IFRAME marginWidth=0
marginHeight=0 src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/81.htm"
frameBorder=0 width=190 scrolling=no
height=88></IFRAME><!-- 今日导读 end --></TD><!-- 今日导读 尺寸189x90 end --></TR></TBODY></TABLE><!-- 顶通广告 end --><!-- 顶通 end --><!-- Google搜索 begin -->
<DIV class=blkTopGoogleSearch><IFRAME marginWidth=0 marginHeight=0
src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/5.htm" frameBorder=0 width=950
scrolling=no
height=34></IFRAME></DIV><!-- Google搜索 end --><!-- 路径导航栏 begin --><A
name=blkBreadcrumb></A><A class=linkQuickJump
href="http://news.sina.com.cn/pl/2008-08-26/082316174130.shtml#Main"><IMG
height=1 alt=跳转到正文内容 src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/c.gif" width=1></A>
<H1 id=pagelogo><A href="http://news.sina.com.cn/" target=_blank><IMG
id=pagelogo_img height=27 alt=新闻中心
src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/con_logo_news_001.gif"
width=119></A></H1></DIV><!-- 频道logo end --><!-- 路径导航 媒体图标 begin --><!-- 路径导航 begin -->
<DIV class=blkBreadcrumbNav>
<P id=lo_links><A href="http://news.sina.com.cn/">新闻中心</A> > <A
href="http://news.sina.com.cn/opinion/">评论</A> > <SPAN
class=linkRed01><A
href="http://news.2008.sina.com.cn/z/focusOlympic/index.shtml">聚焦奥运专题</A></SPAN> > 正文</P></DIV><!-- 路径导航 end --><!-- 媒体图标 begin -->
<DIV class=blkMediaLogo id=media_logo><A href="http://www.dayoo.com/"
target=_blank><IMG
src="吴祚来:奥运会开幕式很中国闭幕式很世界_新闻中心_新浪网_files/U868P1T31D9F479DT20060206172555_s.jpg"
onload=javascript:DrawImage(this) border=0></A></DIV><!-- 媒体图标 end --><!-- 路径导航 媒体图标 end --></DIV><!-- 路径导航栏 end --><!-- 主容器 begin --><A
name=Main></A>
<H1 id=artibodyTitle>吴祚来:奥运会开幕式很中国闭幕式很世界</H1>
<DIV class=artInfo><SPAN
id=art_source>http://www.sina.com.cn</SPAN>  <SPAN
id=pub_date>2008年08月26日08:23</SPAN>  <SPAN id=media_name><A
href="http://www.dayoo.com/" target=_blank>大洋网-广州日报</A> </SPAN></DIV><!-- 正文内容 begin --><!-- google_ad_section_start -->
<DIV class=blkContainerSblkCon id=artibody>
<P>  <STRONG>作者:吴祚来</STRONG></P>
</P></DIV><!-- google_ad_section_end --> <!-- 正文内容 end --><BR></DIV><!-- 发表评论 begin -->
<DIV class=blkComment>
<P><A class=blkCommentLinkPost
href="http://comment.2008.sina.com.cn/comment/comment4.html?channel=gn&newsid=1-1-16174130&style=0"><SPAN
style="DISPLAY: none; MARGIN-RIGHT: 12px" show_limit="20,0" p_expara=""
p_url="http://news.sina.com.cn/pl/2008-08-26/082316174130.shtml"
p_key="1-1-16174130" p_id="1001" cmnt_id="gn:1-1-16174130:0"
name="cmnt_count">已有<SPAN class=f_c00>_COUNT_</SPAN>位网友发表评论</SPAN>
我要评论</A></P></DIV><!-- 发表评论 end --><!-- 李宁为中国队夺金注入信念 开始 -->
<TABLE cellSpacing=0 width=589>
<TBODY>
<TR vAlign=center align=left>
<TD>
<TABLE cellSpacing=0>
<TBODY>
<TR vAlign=center align=left>
<TD>
<DIV id=sTb1>
<FORM name=gform2 onsubmit="return checkSearchValue1_2();"
action=http://www.google.cn/search method=get target=_blank><INPUT
type=hidden value=aff-sina name=client> <INPUT type=hidden value=gb
name=ie> <INPUT type=hidden value=utf8 name=oe> <INPUT type=hidden
value=zh-CN name=hl> <INPUT type=hidden value=contentsearchblow
name=channel>
<TABLE cellSpacing=0>
<TBODY>
<TR vAlign=center align=left>
<TD width=45><INPUT style="FONT-SIZE: 12px; WIDTH: 35px; HEIGHT: 20px; TEXT-ALIGN: center" type=submit value=搜索></TD></TR></TBODY></TABLE></FORM></DIV>
<DIV id=sTb2 style="DISPLAY: none">
<FORM name=sb02_2 onsubmit="return checkSearchValue2_2();"
action=http://iask.com/n target=_blank>
<TABLE cellSpacing=0>
<TBODY>
<TR vAlign=center align=left>
...全文
89 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
wis2007 2008-09-01
  • 打赏
  • 举报
回复
谢谢zzxap!
Atai-Lu 2008-08-29
  • 打赏
  • 举报
回复
/<[^>]*>/img
zzxap 2008-08-29
  • 打赏
  • 举报
回复

//删除脚本
Htmlstring = Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring,@"<(.[^>]*)>","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"-->","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"<!--.*","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(quot|#34);","\"",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(amp|#38);","&",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(lt|#60);","<",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(gt|#62);",">",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(nbsp|#160);"," ",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(iexcl|#161);","\xa1",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(pound|#163);","\xa3",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(copy|#169);","\xa9",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&#(\d+);","",RegexOptions.IgnoreCase);

Htmlstring.Replace("<","");
Htmlstring.Replace(">","");
Htmlstring.Replace("\r\n","");
Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;

28,390

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧