• 全部
  • C#综合技术
  • C#互联网桌面应用
  • AppLauncher
  • WinForm&WPF
  • C#开发新技术
  • 问答

关于使用HttpWebResponse获取页面数据的问题?

userxk 2005-08-03 04:00:49
看了很多关于HttpWebResponse的文章,但是用HttpWebResponse得到的是包括HTML标记在内的所有页面内容,我现在只想要得到除去HTML标记以外的有用数据信息,该怎么来做?
...全文
224 点赞 收藏 6
写回复
6 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
中国小蛇 2005-11-25
这几天遇到和楼主一样的问题,看到楼主找到方法但没有公布感觉有些气愤:(。可能其它人未理解楼主的准确意思,所以感觉大家的回答有些不得其法,贴子虽已结,不过今天找到解决方案与大家分享一下:

例如调用response.write("hello");后,默认客户端收到的数据流以hello开头,后面还会接<html>...的网页HTML元素。办法是改成下面的格式:

Reponse.write("hello");
Response.End();
调用End()是告诉服务器端,返回流内容到此为止,不再自动生成其它HTML元素内容。

不知楼主用到的是不是这个方法?如有曲解还望见谅!
回复
shrinerain 2005-08-04
楼主最后用的什么?
回复
userxk 2005-08-04
谢谢!俺已搞定,不过不是用的正则表达式.
回复
活靶子哥哥 2005-08-03


<%@Page Language="c#" Debug="true"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="gb2312" lang="gb2312">
<head>
<title> New Document </title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<meta name="title" content="" />
<meta name="subject" content="" />
<meta name="language" content="gb2312" />
<meta name="keywords" content="" />
<meta name="robots" content="all" />
<script langauge="c#" runat="server">

void Page_Load(object o , EventArgs e)
{

if(!Page.IsPostBack)
{
string s = @"<span class='lframe-t-text'>今日<font color='red'>热门新闻</font></span><div>adfadf</div>";
s = System.Text.RegularExpressions.Regex.Replace(s,"<[^>]+>","");
Response.Write(s);
}

}

</script>
</head>
<body>
<form id="frm" runat="server">



</form>
</body>
</html>
回复
userxk 2005-08-03
不会吧?用正则表达式那不整死人了.我要的信息内容很多呀!然后还要对信息内容按规则拆分开,不妥!不妥!
回复
iloveyour 2005-08-03
根据需要用正则表达式提取有用信息
回复
发帖
C#
创建于2007-09-28

10.5w+

社区成员

.NET技术 C#
申请成为版主
帖子事件
创建了帖子
2005-08-03 04:00
社区公告

让您成为最强悍的C#开发者