如何从htm文件提取纯文本内容

george77 2001-06-04 03:20:00
如何从htm文件提取纯文本内容
...全文
183 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
捕鲸叉 2001-07-17
  • 打赏
  • 举报
回复
用EditView一样
捕鲸叉 2001-07-17
  • 打赏
  • 举报
回复
将htm文件的内容拷贝到剪贴板,再粘帖到记事本(notepad.exe)上
george77 2001-07-17
  • 打赏
  • 举报
回复
比如,我打开一个htm文件,就要取得其中纯文本内容
george77 2001-06-05
  • 打赏
  • 举报
回复
我想用com来解决这个问题,各位能否详细地介绍一下
jimconrad 2001-06-04
  • 打赏
  • 举报
回复
需要用到com吗?用哪个组件可以告知吗?
我想直接对htm文件进行分析不是更方便?
flywhc 2001-06-04
  • 打赏
  • 举报
回复
使用COM,先打开这个html,然后
document.body.innerText就是你要的了

简单的方法是做个浏览器(到处都有例子),把它隐藏起来,然后获得上面这个属性
freespider 2001-06-04
  • 打赏
  • 举报
回复
将所有符号(如:<head>,<body>,<table>)去掉,剩下的就是纯文本了,
不知道是不是这个意思
plato 2001-06-04
  • 打赏
  • 举报
回复
请参阅Internet Explorer SDK(MSDN中带),不过要假设你对COM比较熟悉,
调用IHTMLDocument等接口的方法。

16,551

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • AIGC Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧