如何提取Word文档内的标题以及正文文字内容?

xiaoxiang2000 2003-06-11 05:18:08
如果可以的话,pdf、html文件的标题以及文字内容如何提取?
...全文
462 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
nik_Amis 2003-06-17
  • 打赏
  • 举报
回复
up
yjsyjs 2003-06-17
  • 打赏
  • 举报
回复
用jni可以实现
zjlgigi 2003-06-16
  • 打赏
  • 举报
回复
小弟不才,我想
HTML文件可能比较容易处理,读入文件分析<title></title>应该可以.
PDF文件则要了解此文件结构才能处理吧.

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧