asp.net新闻采集系统

JYJjiayunjie 2009-08-15 09:12:57
我们公司让我一个人做个小型新闻采集系统,关键是我都没有接触过,一点思路都没有,做这个需要什么技术,原理啊什么的有没有源码呢,从网上搜了,但是都不是我想要的,也没有很清楚的代码,我该怎么做呢,头大。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
如果一个人做成什么程度可以?应该如何下手哩
...全文
1300 28 打赏 收藏 转发到动态 举报
写回复
用AI写文章
28 条回复
切换为时间正序
请发表友善的回复…
发表回复
wanggenhu0 2011-06-24
  • 打赏
  • 举报
回复
不错,学习一下!!!!!!!11
youkuwanhuo 2011-04-14
  • 打赏
  • 举报
回复
我也在做采集的东西 思路有了还没有实现 呵呵
creatdatabase 2011-03-26
  • 打赏
  • 举报
回复
up...我也不知道怎么做,很想知道怎么实现这个功能
aujie 2010-01-14
  • 打赏
  • 举报
回复
楼主啊,这个问题解决了没?
小弟我也碰到这个问题,请帮一下!
dojava 2009-08-22
  • 打赏
  • 举报
回复
有个网站有,技术还挺先进的.你去看看吧.视采采集器需求分析.兄弟记得给分!
yjxsf8313 2009-08-18
  • 打赏
  • 举报
回复
需求文档。。。。。。。。。。。。。。。
JYJjiayunjie 2009-08-18
  • 打赏
  • 举报
回复
数据挖掘?
wolf11th 2009-08-18
  • 打赏
  • 举报
回复
得去看店数据挖掘方面的东西
JYJjiayunjie 2009-08-18
  • 打赏
  • 举报
回复
谁能给一份需求文档,这个系统的,呵呵,功能复杂简单的都行,我要写写需求,但是找不到。
JYJjiayunjie 2009-08-17
  • 打赏
  • 举报
回复
c/s的。。大家说的都是b/s的吧,不是我不想说清需求而是老板啥都没有说就给我了,让我做,我都没有接触过,还要和我讨论,他都什么不懂,我郁闷死啦,和他说更生气。哎。。。。还让做成c/s的。这个大部分都是b/s的吗?
JYJjiayunjie 2009-08-17
  • 打赏
  • 举报
回复
c/s
Jelindu 2009-08-15
  • 打赏
  • 举报
回复
不懂你所说的新闻采集系统,是指自己发布新闻,还是去采集别人的新闻数据?
niitnanfeng 2009-08-15
  • 打赏
  • 举报
回复
up
huoyanna91accp 2009-08-15
  • 打赏
  • 举报
回复
用到的技术就是您怎么在联网的情况下运用网上提供的人rss
怎么从rss及xml文件中读取并显示在界面上
cygmacel 2009-08-15
  • 打赏
  • 举报
回复
public string GetHtmlCode(string Url) //获取html页面代码
{
try
{
Uri uri = new Uri(Url);
HttpWebRequest requestPage = (HttpWebRequest)WebRequest.Create(uri);
//requestPage.Timeout = 6000;
WebResponse response = requestPage.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));
//StreamReader reader = new StreamReader(response.GetResponseStream(), System.Text.Encoding.UTF8);
return reader.ReadToEnd();
}
catch (Exception ex)
{
return ex.Message;
}
}

public string GetStartEndHtmlCode(string htmlCode,string startHtmlCode,string endHtmlCode) //截取指定开始,结束位置字符
{
//int startCount = htmlCode.LastIndexOf(startHtmlCode) + startHtmlCode.Length;
//int endCount = htmlCode.LastIndexOf(endHtmlCode) - startCount - endHtmlCode.Length;

int startCount = htmlCode.IndexOf(startHtmlCode);
int endCount = htmlCode.IndexOf(endHtmlCode)-startCount;

try
{
return htmlCode.Substring(startCount, endCount);
}
catch (Exception ex)
{
return ex.Message;
}
}

public string GetTitleUrl(string htmlCode,string RegexString) //根据正则表达式提示章节名称及超链接
{
string MatchVale = "";
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((\w|\\|\/|\.|:|-|_)+)('|""| *|>)?";
string Reg2 = @"href=(.*?)>(.*?) </a>";
string Reg3 = @">(.*?) </a>";
foreach (Match m in Regex.Matches(htmlCode,Reg2))
{

//MatchVale += (m.Value).ToLower().Replace("href=", "").Trim()+"\r\n";
string temp = Regex.Match(m.Value, Reg).Value.Replace("href=", "").Replace("\"","");
string temp2 = Regex.Match(m.Value, Reg3).Value.Replace(" </a>", "").Replace(">",""); ;
MatchVale+= temp + " " + temp2 + "\r\n";
//MatchVale += m.Value.ToLower().Replace("\"","").Replace("'","") + "\r\n";
}
return MatchVale;
}
JYJjiayunjie 2009-08-15
  • 打赏
  • 举报
回复
haishi meiyou ren a
wuyq11 2009-08-15
  • 打赏
  • 举报
回复
WebRequest HttpWebRequest = null;
WebResponse HttpWebResponse = null;
HttpWebRequest = WebRequest.Create(url);
HttpWebResponse = HttpWebRequest.GetResponse();获取信息,再用正则格式化
看看动网新闻采集系统,下载里资源很多
采集采集
JYJjiayunjie 2009-08-15
  • 打赏
  • 举报
回复
ziji ding
fengying0529 2009-08-15
  • 打赏
  • 举报
回复
你该把你的需求讲清楚点嘛
wu1987116 2009-08-15
  • 打赏
  • 举报
回复
获取要采集的网站地址,获取文件源代码,分析。
正则提取
加载更多回复(6)

62,052

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧