如何用c或者c++从网页页面上获取信息

hotdog04 2012-07-18 01:57:17
大家好,我想用c代码从一个网站上自动读取数据,请帮忙提供方法。
谢谢。最好直接有可以运行的简单的代码,c++代码也可以。谢谢、
...全文
765 11 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
hotdog04 2012-07-18
  • 打赏
  • 举报
回复
我 不会网络编程,4楼如果你真的懂的话,能不能发个简单可执行的代码。我可以测试一下。谢谢,其他楼的如果你们真的能提供相关的资料,请写具体些。我可以自己查阅相关资料,论坛不是泡的,我希望能够通过交流快速的掌握一些知识点。本人其实是数据库方向的,回帖的话,请回复高质量的贴子,不然只会浪费双份的时间。
陈厚来 2012-07-18
  • 打赏
  • 举报
回复
方法太多了,4楼的办法其实很正统。

投机点+复杂点的,用C++调用浏览器COM对象,再通过DOM接口,抓到HTML或javascript的元素、调用javascript函数都没问题,codeproject上类似例子很多了。
http://www.codeproject.com/Articles/2352/JavaScript-call-from-C

投机点+简单点的,下一个wget程序,用wget访问网页,并将网页内容从标准输出打出来。
这样popen函数调用 wget程序,抓到wget的输出就OK了。

hotdog04 2012-07-18
  • 打赏
  • 举报
回复
好像答案都不给力啊。
夏天__ 2012-07-18
  • 打赏
  • 举报
回复
需要用到协议分析,抓包吧,
帅得不敢出门 2012-07-18
  • 打赏
  • 举报
回复
用curl库很方便
gold_water 2012-07-18
  • 打赏
  • 举报
回复
DWORD dst_ip = htonl(globalServerIP);


SOCKET sockClient = socket(AF_INET,SOCK_STREAM,0);
if ( INVALID_SOCKET == sockClient)
{
AfxMessageBox("客户端创建套接字失败!");
return ;
}

int PORT = 20002;
int FLAG = 2;

SOCKADDR_IN addrSrv;
addrSrv.sin_addr.S_un.S_addr = dst_ip;
addrSrv.sin_family = AF_INET;
addrSrv.sin_port = htons(PORT);

if(SOCKET_ERROR == connect(sockClient,(SOCKADDR*)&addrSrv,sizeof(SOCKADDR)))
{
AfxMessageBox("连接服务器失败!");
closesocket(sockClient);
return;
}

char *readbuf = new char[1024];
memset(readbuf,0,1024);

recv(sockClient,readbuf,1024,0);

Ansi22Utf8 au;
char* bb;

bb = au.UTF8ToANSI(readbuf);

CString tmp = bb;
AfxMessageBox(tmp);

//delete [] readbuf;

char* buf = new char[1024];
memset(buf,0,strlen(buf));
/* * {
* “type”:”login”,logout
* “data”:”printserverId”
* }
*/

strcpy(buf , "{\"type\":\"login\",\"data\":\"");

strcat(buf,globalPrnSerId);

strcat(buf,"\"}\r\n");

if(SOCKET_ERROR == send(sockClient,buf,strlen(buf),0))
{
AfxMessageBox("发送消息失败.");
closesocket(sockClient);
delete [] buf;
return;
}

delete [] buf;


memset(readbuf,0,1024);

recv(sockClient,readbuf,1024,0);

delete [] readbuf;


closesocket(sockClient);
AnYidan 2012-07-18
  • 打赏
  • 举报
回复
深入理解计算机系统

最后一两章
AnYidan 2012-07-18
  • 打赏
  • 举报
回复
深入理解计算机系统

最后一两章
W170532934 2012-07-18
  • 打赏
  • 举报
回复
了解http协议么?会用socket吧??
CppCoder 2012-07-18
  • 打赏
  • 举报
回复
读取网页到内存
按协议(html、xml...)解析内存中的数据
输出解析结果
寻找自我 2012-07-18
  • 打赏
  • 举报
回复
不知道你要抓什么 爬下来 分析就是了。

70,024

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧