关于使用HttpWebResponse获取页面数据的问题？

userxk 2005-08-03 04:00:49

看了很多关于HttpWebResponse的文章，但是用HttpWebResponse得到的是包括HTML标记在内的所有页面内容，我现在只想要得到除去HTML标记以外的有用数据信息，该怎么来做？

...全文

390 6 打赏收藏转发到动态举报

写回复

用AI写文章

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

中国小蛇 2005-11-25

打赏
举报

这几天遇到和楼主一样的问题，看到楼主找到方法但没有公布感觉有些气愤:(。可能其它人未理解楼主的准确意思，所以感觉大家的回答有些不得其法，贴子虽已结，不过今天找到解决方案与大家分享一下：

例如调用response.write("hello");后，默认客户端收到的数据流以hello开头，后面还会接<html>...的网页HTML元素。办法是改成下面的格式：

Reponse.write("hello");
Response.End();
调用End（）是告诉服务器端，返回流内容到此为止，不再自动生成其它HTML元素内容。

不知楼主用到的是不是这个方法？如有曲解还望见谅！

shrinerain 2005-08-04

打赏
举报

楼主最后用的什么？

userxk 2005-08-04

打赏
举报

谢谢!俺已搞定,不过不是用的正则表达式.

活靶子哥哥 2005-08-03

打赏
举报

<%@Page Language="c#" Debug="true"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="gb2312" lang="gb2312">
<head>
<title> New Document </title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<meta name="title" content="" />
<meta name="subject" content="" />
<meta name="language" content="gb2312" />
<meta name="keywords" content="" />
<meta name="robots" content="all" />
<script langauge="c#" runat="server">

void Page_Load(object o , EventArgs e)
{

if(!Page.IsPostBack)
{
string s = @"<span class='lframe-t-text'>今日<font color='red'>热门新闻</font></span><div>adfadf</div>";
s = System.Text.RegularExpressions.Regex.Replace(s,"<[^>]+>","");
Response.Write(s);
}

}

</script>
</head>
<body>
<form id="frm" runat="server">

</form>
</body>
</html>

userxk 2005-08-03