关于使用HttpWebResponse获取页面数据的问题?

userxk 2005-08-03 04:00:49
看了很多关于HttpWebResponse的文章,但是用HttpWebResponse得到的是包括HTML标记在内的所有页面内容,我现在只想要得到除去HTML标记以外的有用数据信息,该怎么来做?
...全文
328 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
中国小蛇 2005-11-25
  • 打赏
  • 举报
回复
这几天遇到和楼主一样的问题,看到楼主找到方法但没有公布感觉有些气愤:(。可能其它人未理解楼主的准确意思,所以感觉大家的回答有些不得其法,贴子虽已结,不过今天找到解决方案与大家分享一下:

例如调用response.write("hello");后,默认客户端收到的数据流以hello开头,后面还会接<html>...的网页HTML元素。办法是改成下面的格式:

Reponse.write("hello");
Response.End();
调用End()是告诉服务器端,返回流内容到此为止,不再自动生成其它HTML元素内容。

不知楼主用到的是不是这个方法?如有曲解还望见谅!
shrinerain 2005-08-04
  • 打赏
  • 举报
回复
楼主最后用的什么?
userxk 2005-08-04
  • 打赏
  • 举报
回复
谢谢!俺已搞定,不过不是用的正则表达式.
活靶子哥哥 2005-08-03
  • 打赏
  • 举报
回复


<%@Page Language="c#" Debug="true"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="gb2312" lang="gb2312">
<head>
<title> New Document </title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<meta name="title" content="" />
<meta name="subject" content="" />
<meta name="language" content="gb2312" />
<meta name="keywords" content="" />
<meta name="robots" content="all" />
<script langauge="c#" runat="server">

void Page_Load(object o , EventArgs e)
{

if(!Page.IsPostBack)
{
string s = @"<span class='lframe-t-text'>今日<font color='red'>热门新闻</font></span><div>adfadf</div>";
s = System.Text.RegularExpressions.Regex.Replace(s,"<[^>]+>","");
Response.Write(s);
}

}

</script>
</head>
<body>
<form id="frm" runat="server">



</form>
</body>
</html>
userxk 2005-08-03
  • 打赏
  • 举报
回复
不会吧?用正则表达式那不整死人了.我要的信息内容很多呀!然后还要对信息内容按规则拆分开,不妥!不妥!
iloveyour 2005-08-03
  • 打赏
  • 举报
回复
根据需要用正则表达式提取有用信息

111,093

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • AIGC Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧