自动抓取别的彩票网站的数据并存入数据库

i08kingdom 2011-10-04 12:00:26
我自己想做一个自动分析彩票数据的彩票软件,但是只会设计简单的网页,故向各位大侠请教一下,希望各位高手不吝赐教并希望越详细越好:
现在主要难题是我需要我的网站自动获取别的彩票网站的数据并自动更新到数据库,我不知道怎么来实现,望各位大侠详细指点。
我是这样想的:在page_load事件中来实现,这样打开网页就能实现把数据存入到数据库,但是不知道后台代码怎么写?
...全文
2571 14 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_17020279 2014-06-28
  • 打赏
  • 举报
回复
如何做成 QDA文件数据呢?
i08kingdom 2012-01-23
  • 打赏
  • 举报
回复
其实3楼的思路也是我想要的思路
但是获取别的网站的源代码的代码是什么呀?
另外怎么去筛选数据呀?我查看了一下网页源代码?筛选起来太难了
不知那位高手能指点一下
  • 打赏
  • 举报
回复
说实在的交流编程语句实在是太“低档”了。如果你可以提出一点关于你的所谓“自动分析”的机制,或许你就可以免费获得实现代码,把一个空想程度很高的事情变成一个很简单的只要忽悠一下就有IT民工给你编程的事情。
  • 打赏
  • 举报
回复
例如这个网址http://www.bwlc.gov.cn/bulletin/search.jsp?id=1,其内容
                <table width="650" cellpadding="2" cellspacing="1" class="tableBack">
<tr class="titleBack">
<td>期号</td>
<td>红球</td>
<td>蓝球</td>
<td>开奖时间</td>
<td>开奖公告</td>
</tr>

<tr class="dataBack1">
<td><a href="index.jsp?id=1&infoId=6413">2011116</a></td>
<td style="color:#F00;">01 07 11 12 17 27</td>
<td style="color:#00F;">05</td>
<td>2011-10-04</td>
<td><a href="index.jsp?id=1&infoId=6413">开奖公告</a></td>
</tr>

<tr class="dataBack2">
<td><a href="index.jsp?id=1&infoId=6408">2011115</a></td>
<td style="color:#F00;">07 08 09 12 17 33</td>
<td style="color:#00F;">16</td>
<td>2011-10-02</td>
<td><a href="index.jsp?id=1&infoId=6408">开奖公告</a></td>
</tr>

<tr class="dataBack1">
<td><a href="index.jsp?id=1&infoId=6402">2011114</a></td>
<td style="color:#F00;">01 14 15 16 30 32</td>
<td style="color:#00F;">09</td>
<td>2011-09-29</td>
<td><a href="index.jsp?id=1&infoId=6402">开奖公告</a></td>
</tr>
......


至于说你要抄什么源代码,我觉得还是你自己思考一下最好。
hwyqy 2011-10-06
  • 打赏
  • 举报
回复
不是很容易
除非模拟用户输入,然后抓取返回的网页分析
huayy 2011-10-06
  • 打赏
  • 举报
回复
看2楼!
程序相对还是很复杂的!呵呵!
kiss筱魔 2011-10-06
  • 打赏
  • 举报
回复
这个想法太好了!
myhope88 2011-10-05
  • 打赏
  • 举报
回复
没这么容易呀,除非你有人家提供的数据接口
xuStanly 2011-10-05
  • 打赏
  • 举报
回复
没那么容易了,一般官方网站上提供的数据都是图片的,还加了水印,非官方的网站上的数据又不会那么可靠.
如果楼主有比较放心的使用纯html提供数据的网站,按5楼的办法就可以了.
lxh0129 2011-10-05
  • 打赏
  • 举报
回复
不对,最好不放在web画面的load事件处理,如果你的网站是为了显示彩票数据和一些指标或算法等信息,那么获取和分析彩票数据部分,应该作为一种“引擎”来处理,像福彩双色球玩法是周二、四、日三天开奖,那么你可以设定引擎在一、三、五自动启动去抓数据,或者干脆每个小时抓一次来的简单。

抓到数据后(一般数据来源于别人的网站,如:官网),先清洗出来数据个体,比如去掉html tag,然后过滤筛选出你要的数据,最后在做些数据的修正处理,比如去掉个位数的前导0,等等。

总之,这是个思路,很容易实现,希望对你有帮助!
神棍 2011-10-04
  • 打赏
  • 举报
回复
应该有彩票的web服务接口,买一个就是了.
星小野 2011-10-04
  • 打赏
  • 举报
回复
在page_load事件中来实现???!!!!
不是吧?先不说安全性,你想你的网页打开时要几分钟么???(有点夸张)

我觉得要很重视用户体验这方法的事情,比如,我买的是A股票,那我登陆以后只需要90%信息是关于A股的,当然还有更多的需求,比如某一股不同时期的比较,同时期之间的比较等等
huxiaowei09 2011-10-04
  • 打赏
  • 举报
回复
网页抓取,1:获取对方网站源码,2:匹配所需数据,3:入库
thewitcher~ 2011-10-04
  • 打赏
  • 举报
回复
"自动获取别的彩票网站的数据"
别的网站的彩票数据??那个网站是你自己写的?
不是的话我想除了黑客攻击别人的网站得到后台数据库外,没有办法了。。

62,243

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧