社区
Java SE
帖子详情
POI抽取word文档内容的问题。帮顶给分
foryouever
2004-12-28 11:26:52
谁有最新版POI提取word内容的方法,或者新版POI的使用说明?
自带的例程功能太简单,只能访问word文档的属性信息,例如作者、修改时间、备注等,没有说明如何提取word文档内容。
...全文
674
46
打赏
收藏
POI抽取word文档内容的问题。帮顶给分
谁有最新版POI提取word内容的方法,或者新版POI的使用说明? 自带的例程功能太简单,只能访问word文档的属性信息,例如作者、修改时间、备注等,没有说明如何提取word文档内容。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
46 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
dongcenphoenix
2005-07-16
打赏
举报
回复
mark
kingxyz
2004-12-30
打赏
举报
回复
POI以前的好像只能支持WORD97版本!因为MS后来WORD版本格式一直没有公布过,不过现在不知道怎么样了!
JACOB可以实现对WORD的全操作,因为本来就是调用COM,需要指定的DLL!
textmining不了解,看看去!
ccwg
2004-12-30
打赏
举报
回复
up
Thisisme
2004-12-30
打赏
举报
回复
ding
night__cat
2004-12-30
打赏
举报
回复
底
foryouever
2004-12-30
打赏
举报
回复
欢迎继续讨论
foryouever
2004-12-30
打赏
举报
回复
up
night__cat
2004-12-30
打赏
举报
回复
down
GJA106
2004-12-29
打赏
举报
回复
word文档数据是经过加密的,自己去作是不大现实,除非知道算法。如果poi实现了的话,可以去下poi的源代码来参考啊!!
Goal3
2004-12-29
打赏
举报
回复
up
foryouever
2004-12-29
打赏
举报
回复
UP
foryouever
2004-12-29
打赏
举报
回复
引入一个新问题,虽然用java抽取word文档到纯文本已经实现了,但是如果要应用到j2me,即移动设备时,会由于poi调用了j2me所不支持的api导致程序出错,但这些api是j2se所支持的。看来作为j2se的简化版,j2me是不会很好的支持poi了,更谈不上使用jacob,因为它需要dll。
希望了解一下doc文档的结构,第一步做到用纯java读出文本内容,不要求排版格式和写入doc文档。不知各位有何高见。
drugon
2004-12-29
打赏
举报
回复
up
CALM
2004-12-29
打赏
举报
回复
关注
thomas_20
2004-12-29
打赏
举报
回复
帮up
foryouever
2004-12-29
打赏
举报
回复
up
foryouever
2004-12-29
打赏
举报
回复
up
baobaoer88
2004-12-29
打赏
举报
回复
学习
foryouever
2004-12-29
打赏
举报
回复
所以叫移植到j2me嘛,移植的过程也就是学习poi源代码,然后根据j2me提供的api进行优化。但是poi里面对word文档操作的部分十分难懂,不知楼上两颗红星的大侠能否介绍一二?
GJA106
2004-12-29
打赏
举报
回复
不能这样作,j2me本来就是一个“携便”版本,很多j2sdk中提供的功能都没有,poi怎么可能在j2me下跑起来呢!
就是要你研究poi包中操作word的那些功能代码,然后移植到j2me中去(该删除的删除掉)。
加载更多回复(26)
2小时学会
POI
报表导入导出功能
Apache
POI
是Apache软件基金会的开放源码函式库,
POI
提供API给Java程序对Microsoft Office格式档案读和写的功能.课程目标 1.
POI
简介2.同类型技术3.
POI
创建表格4.创建工作簿5.写入
内容
6.结合页面导入导出功能2.
POI
...
Spring Boot(六十八):SpringBoot 整合Apache tika 实现文档
内容
解析
Apache Tika 是一个开源的
内容
检测和
分
析框架,由Apache软件基金会开发和维护的顶级项目。它可以从各种格式的文件中提取元数据和文本
内容
。Tika非常适合处理全文搜索、
内容
分
析、翻译、
内容
提取等需要大量处理和
分
析...
【地理人工智能交叉】通过整合兴趣点和Word2Vec模型感知城市土地利用的空间
分
布
POI
2Vec,结合word2vec的思想进行土地使用类型辨认。
Jakarta
POI
3.0—访问微软Office格式文件的Java API
这个发布版本增加了对MS Excel公式的支持,改善了对Power
Poi
nt的支持,以及对MS
Word文档
的图像
抽取
功能。
POI
的用户还通过许多子项目来处理这些格式的不同形式:
POI
FS 对于MS Office文档文件结构的访问 HSSF MS ...
Jakarta
POI
3.0
Jakarta
POI
3.0——访问微软Office的Java API...久负盛名的Java类库,提供读写微软Office某些文档格式能力的Jakarta
POI
已经发布3.0版本。这个发布版本增加了对MS Excel公式的支持,改善了对Power
Poi
nt的
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章