如何提取网页中的文字?

rfit 2001-05-07 01:43:00
我要在我的程序中加入这个功能,在特定的网页中提取文字。

类似新闻下载软件。 每次上网,执行程序,他可以把sohu(举例) 的新闻版块的
新闻下载到电脑里。

如何做到?   有过这方面的资料请贴上来,谢谢

请告诉我核心的实现技术
...全文
744 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
adone 2001-05-09
  • 打赏
  • 举报
回复
用Chttpconnection, Socket, 或者htmlview 都成,关键是down下来的文本要分析,
怎么取出你想要的,sina可以做到因为他这边也有服务器端,发请求服务器端就知道你要什么。你要是向web发请求,拿下来的和ie拿下来的没有什么分别,要去分析html源文件,找到你想要的东东
panch 2001-05-09
  • 打赏
  • 举报
回复
用CHttpFile类
rfit 2001-05-09
  • 打赏
  • 举报
回复
gz
supperlxf 2001-05-07
  • 打赏
  • 举报
回复
还不自动啊,程序一打开就能浏览了
wkp 2001-05-07
  • 打赏
  • 举报
回复
我以前做过一个,可就是不能实现自动下载!
bluestar 2001-05-07
  • 打赏
  • 举报
回复
如果是xml就好了,根据标记就知道要找的东西。
kimryo 2001-05-07
  • 打赏
  • 举报
回复
干脆做个新闻组算了...
chendd2001 2001-05-07
  • 打赏
  • 举报
回复
hao wen ti
ren20 2001-05-07
  • 打赏
  • 举报
回复
这种方法好象不太好呀。 我说的功能要能自动下载。
supperlxf 2001-05-07
  • 打赏
  • 举报
回复
最简单的方法:
将ie控件放倒你的程序中,将sohu(举例)的新闻版的url做为ie控件的一个参数输入.就像你的程序中内置一个浏览器一样
kimryo 2001-05-07
  • 打赏
  • 举报
回复
VCL中有一个类包,叫"IHTML...",可参考一下。

16,473

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧