关于get网页内容?急 在线等

李雷 2008-06-10 09:43:41
我想写个函数用来获取网页htm里的文本内容

重要的是不使用MFC的类库:比如openurl这样的函数不使用MFC的 我想用C语言来写 因为比如说套接字 get请求等

要稳定的获取网页文本内容 最好不需要下载文件 直接读到内存里最好

不知道用什么方法好?????
...全文
117 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
jameshooo 2008-06-10
  • 打赏
  • 举报
回复
InternetConnect
HttpOpenRequest+HttpSendRequest or InternetOpenUrl
HttpQueryInfo
InternetReadFile
InternetCloseHandle
李雷 2008-06-10
  • 打赏
  • 举报
回复
自己先顶下
李雷 2008-06-10
  • 打赏
  • 举报
回复
InternetReadFile

#include <wininet.h>

#pragma comment(lib,"wininet.lib")
这个也可以 谁能演示下 我加分
李雷 2008-06-10
  • 打赏
  • 举报
回复
int retval = send(cli_sock,sz,sizeof(sz)-1,0);
if( SOCKET_ERROR == retval )
return 0;
char buffer[1024]={0};
retval = recv(cli_sock ,buffer,1000,0);
printf("%s\n",buffer);
closesocket(cli_sock);

不循环可以诶
不知道 不循环会不会有时候获取不了
李雷 2008-06-10
  • 打赏
  • 举报
回复
循环退出不了啊 郁闷
  • 打赏
  • 举报
回复
请求的那一句改为
char sz[]="GET /mp3.txt HTTP/1.1\r\nHost:www.baidu.com\r\n\r\n";

具体的规则你看看http的协议文档吧
scq2099yt 2008-06-10
  • 打赏
  • 举报
回复
可否把html文件当作文本文件读取,获取文本文件中内容。
李雷 2008-06-10
  • 打赏
  • 举报
回复
如何get一个域名文件呢 比如http://www.baidu.com/mp3.txt呢?
  • 打赏
  • 举报
回复
访问baidu主页的例子。

#include <winsock2.h>
#include<windows.h>
#include<stdio.h>
#pragma comment(lib, "ws2_32.lib")

int main(int argc, char* argv[])
{
char server_name[256]= "www.baidu.com";
WSADATA wsaData;
struct sockaddr_in srv_addr;

if (WSAStartup(0x202,&wsaData) == SOCKET_ERROR) {
WSACleanup();
return -1;
}

SOCKET cli_sock=socket(PF_INET,SOCK_STREAM,0);
if (cli_sock==INVALID_SOCKET)
return -1;

unsigned short netshort = 80;
srv_addr.sin_family = AF_INET;
LPHOSTENT lphost = gethostbyname(server_name);
if (lphost != NULL)
srv_addr.sin_addr.s_addr = ((LPIN_ADDR)lphost->h_addr)->s_addr;
srv_addr.sin_port= htons(netshort);
if (connect(cli_sock,(LPSOCKADDR)&srv_addr,sizeof(srv_addr))==SOCKET_ERROR){
return -1;
}

char sz[]="GET / HTTP/1.1\r\nHost:www.baidu.com\r\n\r\n";
int retval = send(cli_sock,sz,sizeof(sz)-1,0);
if( SOCKET_ERROR == retval )
return 0;
char buffer[1024]={0};
while( SOCKET_ERROR != retval ){
retval = recv(cli_sock ,buffer,1000,0);
printf("%s\n",buffer);
}
closesocket(cli_sock);
return 0;
}
jameshooo 2008-06-10
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 jameshooo 的回复:]
InternetConnect
HttpOpenRequest+HttpSendRequest or InternetOpenUrl
HttpQueryInfo
InternetReadFile
InternetCloseHandle
[/Quote]
李雷 2008-06-10
  • 打赏
  • 举报
回复
HINTERNET如何初始化呢 给个调用例子吧
day572 2008-06-10
  • 打赏
  • 举报
回复
BOOL GetFile (HINTERNET IN hOpen, // Handle from InternetOpen()
CHAR *szUrl, // Full URL
CHAR *szFileName) // Local file name
{
DWORD dwSize;
CHAR szHead[] = "Accept: */*\r\n\r\n";
VOID * szTemp[25];
HINTERNET hConnect;
FILE * pFile;

if ( !(hConnect = InternetOpenUrl ( hOpen, szUrl, szHead,
lstrlen (szHead), INTERNET_FLAG_DONT_CACHE, 0)))
{
cerr << "Error !" << endl;
return 0;
}

if ( !(pFile = fopen (szFileName, "wb" ) ) )
{
cerr << "Error !" << endl;
return FALSE;
}
do
{
// Keep coping in 25 bytes chunks, while file has any data left.
// Note: bigger buffer will greatly improve performance.
if (!InternetReadFile (hConnect, szTemp, 50, &dwSize) )
{
fclose (pFile);
cerr << "Error !" << endl;
return FALSE;
}
if (!dwSize)
break; // Condition of dwSize=0 indicate EOF. Stop.
else
fwrite(szTemp, sizeof (char), dwSize , pFile);
} // do
while (TRUE);
fflush (pFile);
fclose (pFile);
return TRUE;
}

15,466

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 进程/线程/DLL
社区管理员
  • 进程/线程/DLL社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧