关于网络爬虫的c++实现

reader116 2013-03-08 11:53:56
小弟先前一直在学java方向,这进公司,老板要我写一个c++的网络爬虫。其实这个网络爬虫的具体实现步骤我都了解。第一步:要学会使用c++打开一个url。第二步:用正则表达式解析该网页中的所有关联的url。第三步:连接数据库,进行数据比对,再导入数据库。第四步:从数据库中导出数据,再持续第一步中的步骤。。。
小弟现在的问题是哈:怎么用c++实现上述步骤啊,(c++只在学校学了半年,学校学的··大家都懂。。)也看到过网上的一些关于怎么打开url的相关贴子,可那些语法基本上全部都看不懂。老板给了我两三个月的时间,如果想对c++这一方面进行恶补一下,需要从哪些方面入手呢。因为感觉直接上代码太困难。有什么推荐的参考书或是些其他的。(不需要听了您的建议就能把c++弄得多么精通,只需要把那个项目弄出来就好··)
望各位牛人快些现身,小弟在此感激不尽···
...全文
2690 16 打赏 收藏 转发到动态 举报
写回复
用AI写文章
16 条回复
切换为时间正序
请发表友善的回复…
发表回复
徐小花 2015-08-25
  • 打赏
  • 举报
回复
引用 3 楼 gpshq 的回复:
http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易
请问这个代码下载下来该怎么运行啊?
gaojing919 2015-05-01
  • 打赏
  • 举报
回复
请问你的问题解决了没?我也遇到了同样的问题,求指导
a1071831805 2015-04-10
  • 打赏
  • 举报
回复
可以用c++调用python,如果老板不懂的话
Amat 2014-10-16
  • 打赏
  • 举报
回复
毕设想做个爬虫 ,求大师源码
oqq3redsf 2014-02-18
  • 打赏
  • 举报
回复
别再这赛时间了。我只有3天时间就要做出来~555哭的心都有了。用了2天时间确定使用什么语言,最后还是觉得C++写会好一些。如果有现成的可以爬的。。。告诉我下 我去研究研究 邮箱570484159@qq.com
zengyecheng2012 2013-03-22
  • 打赏
  • 举报
回复
引用 8 楼 gpshq 的回复:
引用 4 楼 reader116 的回复:引用 3 楼 gpshq 的回复:http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易 那个我也找到了··感觉看着太乱,而且根本在vs 2010上面跑不起来。现在个人感觉是c++网络编程的东西欠缺太多。而且那上面……
昨天去面试,全给的是百度实习生的试题,一个刚成立的公司,够给力的。被完虐
zengyecheng2012 2013-03-22
  • 打赏
  • 举报
回复
引用 4 楼 reader116 的回复:
引用 3 楼 gpshq 的回复:http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易 那个我也找到了··感觉看着太乱,而且根本在vs 2010上面跑不起来。现在个人感觉是c++网络编程的东西欠缺太多。而且那上面一般的类在msdn library上也查找……
可以跑的。有一个地方是不行的。就是把常量字符串给字符串指针了。把那个指针前加个const就可以跑。
ShengFei01 2013-03-08
  • 打赏
  • 举报
回复
网络爬虫实际上就是使用HTTP协议,你可以参考《WinSock网络编程经络》,有对HTTP的解释和实现(HttpClnt),例子: http://download.csdn.net/detail/geoff08zhang/4571358
scream7 2013-03-08
  • 打赏
  • 举报
回复
如果可以用python的话,几十行的问题
reader116 2013-03-08
  • 打赏
  • 举报
回复
引用 3 楼 gpshq 的回复:
http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易
那个我也找到了··感觉看着太乱,而且根本在vs 2010上面跑不起来。现在个人感觉是c++网络编程的东西欠缺太多。而且那上面一般的类在msdn library上也查找不出来。。。
氰客 2013-03-08
  • 打赏
  • 举报
回复
http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易
hen_hao_ji 2013-03-08
  • 打赏
  • 举报
回复
有开源的 爬虫啊
reader116 2013-03-08
  • 打赏
  • 举报
回复
弄不出来 就要滚蛋了 啊···
reader116 2013-03-08
  • 打赏
  • 举报
回复
引用 7 楼 jiangweilian 的回复:
我就是做爬虫的,不知道你要问什么问题!还有我都是自己学的!我用了一个月的时间就会了,你还有三个月的时间足够了
留个联系方式呗,QQ:990932621。
氰客 2013-03-08
  • 打赏
  • 举报
回复
引用 4 楼 reader116 的回复:
引用 3 楼 gpshq 的回复:http://download.csdn.net/detail/massa1124/3342771 感觉代码很多吧!参考一下,对应你的需求写个简单的应该还是容易 那个我也找到了··感觉看着太乱,而且根本在vs 2010上面跑不起来。现在个人感觉是c++网络编程的东西欠缺太多。而且那上面一般的类在msdn library上也查找……
你大概参照一下别人的写法就OK了,自己划分一下功能模块,看看需要哪些方面的知识,才好入手啊。我大学的时候搞了一下,不考虑算法效率什么的,这个应该不是很难吧。
事后猪葛 2013-03-08
  • 打赏
  • 举报
回复
我就是做爬虫的,不知道你要问什么问题!还有我都是自己学的!我用了一个月的时间就会了,你还有三个月的时间足够了

64,647

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧