c++ 如何抓取双色球的历史开奖数据?

gasdfrewqq 2015-02-03 03:53:21
求教 如何用c++ 如何抓取双色球的历史开奖数据?
...全文
566 8 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
gasdfrewqq 2015-02-04
  • 打赏
  • 举报
回复
谢谢 各位了,我先看看js加载如何弄,这个先结贴了
野男孩 2015-02-03
  • 打赏
  • 举报
回复
用libcurl库开发,按http协议访问网站页面,分析页面数据即可
encoderlee 版主 2015-02-03
  • 打赏
  • 举报
回复
很多彩票网站都没有用JS动态加载数据,像这个百度乐彩就没有,即GET获取到HTML后,HTML中已经有彩票数据了。
根据URL http://baidu.lecai.com/lottery/draw/list/50?agentId=5555发起GET请求,从获取到的HTML中提取出开奖数据:
jiht594 2015-02-03
  • 打赏
  • 举报
回复
引用 4 楼 gasdfrewqq 的回复:
http://baidu.lecai.com/lottery/draw/list/50?agentId=5555 像这个网站上的数据如何抓取啊
如果是用js来请求http, 模拟这个请求就可以了 如果是js加工数据, 你也要模拟js这个逻辑来处理数据,(比如js把20个数,每个都+1. 你得到数据后也要都+1.) 有些网站需要一些验证信息,比如head信息,cookie信息等. 总而言之, 你的程序要完全模拟浏览器请求. 看一下这个模拟登录百度的http://www.crifan.com/emulate_login_website_using_python/ 不是C++, 主要看一下原理. 大概说一下,登录百度需要获得一个BAIDUID值,然后再获取一个token值,然后才可以登录.不是有帐号和密码就行的. 你看一下怎么分析出来需要BAIDUID,token这2个值的. 然后分析一下, 你的这个网址需不需要得到什么值,再抓数据
gasdfrewqq 2015-02-03
  • 打赏
  • 举报
回复
http://baidu.lecai.com/lottery/draw/list/50?agentId=5555 像这个网站上的数据如何抓取啊
gasdfrewqq 2015-02-03
  • 打赏
  • 举报
回复
谢谢 这个是个方法,还有没有在直接抓取带js的网站数据的方法么?
encoderlee 版主 2015-02-03
  • 打赏
  • 举报
回复
楼上正解,此类数据一般都是去彩票网站上爬取。 使用WinInet、WinHTTP、libcurl等库向彩票网站的Web服务器发起GET请求,获取页面HTML数据, 然后用字符串搜索法、正则表达式或HTML解析器从HTML文档中提取出你想要的开奖数据。
jiht594 2015-02-03
  • 打赏
  • 举报
回复
去有数据的网站,把数据下载来不就行了 比如这个网站 http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html到 http://kaijiang.zhcw.com/zhcw/html/ssq/list_88.html 下载html文件, 然后把数据分析出来, 再存起来

65,186

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧