社区
网络及通讯开发
帖子详情
怎么获取网页标签中的内容
ranysky
2007-06-12 10:59:24
我一个程序中想取得一已知网页中某些标签中的内容,例如从代码<title>CSDN社区中心</title> 中取得"CSDN社区中心"几个中文字符;或者从<img src="images/bg.jpg"></img>中的"images/bg.jpg",请问有什么好的实现方法!
...全文
459
11
打赏
收藏
怎么获取网页标签中的内容
我一个程序中想取得一已知网页中某些标签中的内容,例如从代码CSDN社区中心 中取得"CSDN社区中心"几个中文字符;或者从中的"images/bg.jpg",请问有什么好的实现方法!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
爱吃饼干的熊猫
2008-08-01
打赏
举报
回复
不错
sz403518525
2007-07-24
打赏
举报
回复
这一句就是返回你要的值:
strfine = (AnsiString)vaa ;
sz403518525
2007-07-24
打赏
举报
回复
#include <Mshtml.h>
TCppWebBrowser *web1;
IHTMLDocument2* pDocument ;
IHTMLElementCollection* p ;
IHTMLElement* link ;
long len ;
HRESULT hr ;
hr = web1->Document->QueryInterface(IID_IHTMLDocument2,(void**)&pDocument) ;
if( !SUCCEEDED(hr) )
{
ShowMessage("链接出错了啊") ;
return false;
}
pDocument->get_all(&p) ;
pDocument->Release() ;
p->get_length(&len) ;
for(int i=0;i<len;i++)
{
IDispatch* pDisp ;
Variant j ;
p->item((Variant)i,j,&pDisp);
hr = pDisp->QueryInterface(IID_IHTMLElement,(void**)&link) ;
if( !SUCCEEDED(hr) )
return false;
pDisp->Release() ;
wchar_t* input ;
link->get_tagName(&input) ;//你可以改成你要的
if( wcscmp(input,L"INPUT")==0 ) //提取所有的input,你可以改成你要的
{
VARIANT v ;
link->getAttribute(L"NAME",0,&v) ;
wchar_t* va = v.bstrVal ;
AnsiString str = (AnsiString)va ;
if (str == name) //提取name为你想要的那一项,因为name是唯一的
{
VARIANT va;
link->getAttribute(L"VALUE",0,&va) ;
wchar_t* vaa = va.bstrVal;
strfine = (AnsiString)vaa ;
break;
}
}
link->Release() ;
}
sharkxie
2007-07-24
打赏
举报
回复
用CppWebBrowser1也可以获取网页内容,特别是对已知网页中某些标签中的内容比较适合
linuxghs
2007-07-24
打赏
举报
回复
用IdHttp控件获得网页的内容。
AnsiString strbody;
strbody = IdHTTP1->Get(url);
strbody就是这个url里的代码,然后再分析这个代码就可以了。
比如Pos、SubString等函数
ranysky
2007-06-12
打赏
举报
回复
我要用BCB编程实现阿,正则可以么?请贴点代码,谢谢
珍惜生命远离CPP
2007-06-12
打赏
举报
回复
MSDOM模型解析 msxml.dll
或者用正则解析也可以
ranysky
2007-06-12
打赏
举报
回复
没有人回答?分太少还是我没说清楚?
pp616
2007-06-12
打赏
举报
回复
纯字符串操作。c标准函数有一堆 stl里有一堆 Vcl里也有有堆 还有正则 会用哪个就用哪个。都能实先你要的功能。
java
获取
html
标签
内容
_java语言
获取
网页
标签
中
的
内容
博主需从新浪网
获取
天气预报的温度值,给出了Java程序代码,使用Jsoup库尝试
获取
网页
中
特定
标签
内容
,但运行结果为空,希望有人帮忙修改程序以
获取
到所需的“27~18度”温度信息。
C#
获取
指定HTML
网页
中
的
标签
内容
本文介绍了一种使用C#进行
网页
内容
抓取的方法,通过Substring函数来快速定位并提取HTML
标签
内的所需
内容
。
提取
网页
中
的href 爬虫_
网页
爬虫学习之
获取
网页
中
标签
内容
该博客介绍了使用Python进行
网页
内容
提取的方法。通过BeautifulSoup库,分别对本地
网页
和真实
网页
进行解析,筛选出
网页
中
的图片链接、标题和href链接等信息,并将其存储在字典
中
输出,展示了爬虫在
网页
内容
提取方面的应用。
用正则
获取
网页
中
的
标签
内容
本文介绍了一种使用正则表达式从HTML
中
特定
标签
提取
内容
的方法,并提供了一个简单工具的后台代码实现。
python
获取
网页
标签
中
的
内容
_python批量
获取
html内body
内容
的实例
有一批介绍城市美食、景点等的html页面,需提取其
中
body
内容
。利用Python的beautifulSoup插件,通过编写代码实现批量处理,将html文件
中
body
内容
抓取并写入指定txt文件,最后完成多个城市
内容
的提取。
网络及通讯开发
1,317
社区成员
8,874
社区内容
发帖
与我相关
我的任务
网络及通讯开发
C++ Builder 网络及通讯开发
复制链接
扫一扫
分享
社区描述
C++ Builder 网络及通讯开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章