java中实现读取word.doc文档分辨标题,文号,签发日期等信息,什么方法可以这个功能

jianglong1224 2018-01-10 10:45:09
java中实现读取word.doc文档分辨标题,文号,签发日期等信息,怎么识别这些标题,文号,签发日期信息
...全文
689 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
ooo-ooo 2018-01-16
  • 打赏
  • 举报
回复
Apache的POI可以拿到整个word文档的字符串,然后自己截取,目前只用过POI的包,其他没用过
飘逸的腿毛 2018-01-15
  • 打赏
  • 举报
回复
可以加书签 使用poi就可以操作找到位置读取内容或者替换
林二棍子 2018-01-11
  • 打赏
  • 举报
回复
读docx文件可以使用docx4j,但是坑爹的是不支持word 2016保存的docx。 如果文件格式非常规范,比如标题的样式一定是标题1,每个章节都有大纲级别,或者文本内容符合一定的规则,理论上是可以实现的。
jianglong1224 2018-01-10
  • 打赏
  • 举报
回复
大神们 求解答。给个思路也行
jianglong1224 2018-01-10
  • 打赏
  • 举报
回复
什么方法可以实现这个功能

67,512

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧