Asp.net写采集问题

wsjrzjp 2012-03-13 09:24:44
Asp.net写采集问题
现在主要写的功能是采集起开始标签到结束标签的思路,这感觉不是很好,不知道还有没有其他的思路方法
...全文
108 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
yksyuan 2012-03-13
  • 打赏
  • 举报
回复
Chinajiyong
可以帮我看下我的问题呢,
http://topic.csdn.net/u/20120312/20/8ab2f0b9-9a4a-416b-9f17-ad529d6e0d8c.html?seed=1511642043&r=77870313

那边我自己顶的。都3连了。。。。
EnForGrass 2012-03-13
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 wsjrzjp 的回复:]

引用 2 楼 yes16ws 的回复:
C# code

/// <summary>
/// 取得网页源码
/// </summary>
/// <param name="url">网页地址,eg: "http://www.yongfa365.com/" </param>
/// <param name="charset">网页编码,eg: Encoding.UTF8……


……
[/Quote]
你给段html代码,你要提取什么?
wsjrzjp 2012-03-13
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 yes16ws 的回复:]
C# code

/// <summary>
/// 取得网页源码
/// </summary>
/// <param name="url">网页地址,eg: "http://www.yongfa365.com/" </param>
/// <param name="charset">网页编码,eg: Encoding.UTF8……
[/Quote]

兄弟,能给个代码是怎么使用正则取内容的事例吗?
yksyuan 2012-03-13
  • 打赏
  • 举报
回复
顶下。实在是 不知道为什么了
yksyuan 2012-03-13
  • 打赏
  • 举报
回复
http://jsq2f.p2sp.baidu.com/queryfid?type=str&url=qvod%3a%2f%2f104285780%7cA7E63C9014A6B181F3A775086A470FCBD198DD93%7c%e7%81%ab%e5%bd%b1%e5%bf%8d%e8%80%85472.rmvb%7c

我的这个地址 ,为什么 获取不了 网页源码啊

总是报:服务器提交了协议冲突. Section=ResponseStatusLine
全局变量 2012-03-13
  • 打赏
  • 举报
回复
有范围就正则取内容,没范围取全部!
小皮不姓皮 2012-03-13
  • 打赏
  • 举报
回复
貌似也只能这样把。

我现在采集还没用正则,不知道哪个效率高
全局变量 2012-03-13
  • 打赏
  • 举报
回复

/// <summary>
/// 取得网页源码
/// </summary>
/// <param name="url">网页地址,eg: "http://www.yongfa365.com/" </param>
/// <param name="charset">网页编码,eg: Encoding.UTF8</param>
/// <returns>返回网页源文件</returns>
public static string GetHtmlSource(string url, Encoding charset)
{
//处理内容
string html = "";
try
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream stream = response.GetResponseStream();
StreamReader reader = new StreamReader(stream, charset);
html = reader.ReadToEnd();
stream.Close();
}
catch (Exception e)
{
}
return html;
}
jiuhexuan 2012-03-13
  • 打赏
  • 举报
回复
一般都是,先缩小采集的源码范围,之后正则匹配标签。
缩小范围,简单的就是设定开始标签,结束标签
jsjhj2008 2012-03-13
  • 打赏
  • 举报
回复
采集的话不是所有网页都会给你采集下来的
要看是否网页有回发的

111,126

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Creator Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧