怎样去掉html标记内容,只剩网页中的数据?

qingpingyouxia 2003-02-12 04:33:58
各位过年好!
请问怎么样去掉NMHTTP得到的数据中的HTML标记,只剩下网页中的数据信息,形如:
原始数据:
<HTML>
<BODY>
...
<TR>AAAA</TR>
</BODY>
</HTML>
处理后:
AAAA

有劳了!
...全文
60 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
qingpingyouxia 2003-02-13
  • 打赏
  • 举报
回复
我要对字符进行处理,没有必要先读入TCppWebBrowser中,处理完以后,再删除临时控件对象吧?
请问有没有更直接的办法?例如字串对象直接访问接口?
不过,还是很感谢l_clove(倚天把剑观沧海·天下) 老兄!加分!
l_clove 2003-02-12
  • 打赏
  • 举报
回复
#include <Mshtml.h>
l_clove 2003-02-12
  • 打赏
  • 举报
回复
用CppWebBrowser控件就可以了。把Get()放在 CppWebBrowser1的OnDocumentComplete()中。
bool __fastcall TForm1::Get(void)
{
IHTMLDocument2 *pDoc=NULL;
IHTMLElement *body;
LPDISPATCH pDisp = NULL;
pDisp =CppWebBrowser1->Document;
if(pDisp)
{
if (SUCCEEDED(pDisp->QueryInterface(IID_IHTMLDocument2, (void**)&pDoc)))
{
pDisp->Release();
wchar_t *txt;
pDoc->get_body(&body);
body->get_outerText(&txt);
pDoc->Release();
body->Release();
Memo1->Text=txt;
return true;
}
}
return false;
}
hnwlk 2003-02-12
  • 打赏
  • 举报
回复
给个思路:
如果固定的<TR>AAAA</TR>格式,可当作字符处理,把<TR>和</TR>之间的字符
取出来。

1,317

社区成员

发帖
与我相关
我的任务
社区描述
C++ Builder 网络及通讯开发
社区管理员
  • 网络及通讯开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧