求asp.net爬虫源代码

achao201 2008-12-04 07:34:28
求asp.net爬虫源代码,能够生成sitemap.xml和sitemap.html 请大家帮忙?
...全文
459 25 打赏 收藏 转发到动态 举报
写回复
用AI写文章
25 条回复
切换为时间正序
请发表友善的回复…
发表回复
shaxiaoliang 2011-03-23
  • 打赏
  • 举报
回复
lucence是爬虫?那个不是吧!!!
shijingli 2010-01-04
  • 打赏
  • 举报
回复
sad
enasp 2009-01-18
  • 打赏
  • 举报
回复
哪有lucence 3.0下啊
tellov 2008-12-05
  • 打赏
  • 举报
回复
5000分,我送上源码,C#开发,winform的,是自己写的用来爬邮件的,多线程,
空心兜兜 2008-12-05
  • 打赏
  • 举报
回复
UP
pgameli 2008-12-05
  • 打赏
  • 举报
回复
爬虫是什么东东啊
mark
zorou_fatal 2008-12-05
  • 打赏
  • 举报
回复
有现成工具。
greatverve 2008-12-05
  • 打赏
  • 举报
回复
关注。
一品梅 2008-12-05
  • 打赏
  • 举报
回复
纯代码写起来是很麻烦。
有没有代码逐层跟踪站点?估计只能使用工具了吧。
通用生成类似站点文件只有网站方提供的吧,或者你要熟悉对方网站才行。
木有好好地研究过,呵呵。

肯定不可能写个通用类,对每个站点都有序规则地爬一遍的 :)
jiang_jiajia10 2008-12-05
  • 打赏
  • 举报
回复
用webrequest

WebRequest Wrq = WebRequest.Create(要爬的地址);
WebResponse Wrs = Wrq.GetResponse();
Stream strm = Wrs.GetResponseStream();
StreamReader sr = new StreamReader(strm, System.Text.Encoding.GetEncoding("UTF-8"));
string allstrm;
allstrm = sr.ReadToEnd();
string strPattern = @"要抓东西的正则";
MatchCollection Matches = Regex.Matches(allstrm, strPattern, RegexOptions.IgnoreCase | RegexOptions.Compiled);
foreach (Match NextMatch in Matches)
{
得到结果 = NextMatch.Groups[0].Value.ToString().Trim();
}

然后你把结果生成XML文件就可以了,写个方法带参数的。
spidershark 2008-12-05
  • 打赏
  • 举报
回复
帮顶
一品梅 2008-12-05
  • 打赏
  • 举报
回复
然后再动态生成xml或根据xsl转换工具转换成相应html。
一品梅 2008-12-05
  • 打赏
  • 举报
回复
httpwebrequest网站首页,然后得到的流READTOEND,形成字符串,然后进行对字符串的解析。
有的网站一般站点地图和菜单项匹配的。
哥本哈士奇 2008-12-05
  • 打赏
  • 举报
回复
完整的爬虫楼主还是看这个吧.
http://www.cnblogs.com/torome/articles/364774.html
哥本哈士奇 2008-12-05
  • 打赏
  • 举报
回复
http://www.codeplex.com/noodle,这个是我写的,功能还不是很完善,而且只能爬一层.
孤独侠客123 2008-12-05
  • 打赏
  • 举报
回复
http://www.codeplex.com/site/search?ProjectSearchText=spider
doorzhaoyang 2008-12-05
  • 打赏
  • 举报
回复
10楼的可以用
浮生若梦丶 2008-12-05
  • 打赏
  • 举报
回复
[Quote=引用 16 楼 tellov 的回复:]
5000分,我送上源码,C#开发,winform的,是自己写的用来爬邮件的,多线程,
[/Quote]
好jian,没晓得现在流行什么?开源!
wo594261 2008-12-05
  • 打赏
  • 举报
回复
不错
风骑士之怒 2008-12-05
  • 打赏
  • 举报
回复
up
加载更多回复(5)

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧