求教高人用apache poi读取WORD文档并保留完整格式的方法。。。

zhangyxh 2012-05-16 03:10:37
需求是这样的,读取WORD文档
要求保留图片、表格、还有文字的样式、段落等等。最终能在网页上显示出来。
在网上找了很多很多的资料了,jacob不错。但无法在linux下使用。
其他的除了POI还有点希望,基本都悲剧。
我也看到CSDN上有很多类似的帖子,最后都没有得到解决
虽然我知道希望不大,还是到这里来发帖试试。
有知道怎么弄的麻烦告知一下,谢谢!
...全文
1345 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
lees889 2014-12-30
  • 打赏
  • 举报
回复
现在也是同样问题,保存不了样式,现在还要求用POI实现生成目录,有大神可以指导下吗?
yu07009 2013-12-17
  • 打赏
  • 举报
回复
换最新的jar包 poi 3.9
clyde_java 2013-12-12
  • 打赏
  • 举报
回复
楼主有没有搞定,我今天也要做一个这样的功能,求解脱..
zhangyxh 2012-05-17
  • 打赏
  • 举报
回复
哎,搞得想死。
试了各种各样的办法,太难了。
还试了直接导入到FCKeditor,有些思路,但只有IE可行,FF、谷歌什么的基本不可能。
听人说用asp.net的话简单很多很多,毕竟是microsoft自己的东西。
太悲剧了。
宗霞恋 2012-05-16
  • 打赏
  • 举报
回复
我这里有加载图片的方法,你可以借鉴一下。

/**
* 加载照片
* @param patriarch 图片编辑对象
* @param wb 文档
* @param col 列号(从0开始)
* @param row 行号(从0开始)
* @param accessoryID
*/
private void loadPicture(HSSFPatriarch patriarch, HSSFWorkbook wb, short col, int row, String accessoryID) {
try{

BufferedImage bufferImg =null;
ByteArrayOutputStream byteArrayOut = new ByteArrayOutputStream();
bufferImg = ImageIO.read(Attachment.download(accessoryID));
ImageIO.write(bufferImg,"jpg",byteArrayOut);
HSSFClientAnchor anchor = new HSSFClientAnchor(0,0,1000,255,col,row,col,row);
patriarch.createPicture(anchor , wb.addPicture(byteArrayOut.toByteArray(),HSSFWorkbook.PICTURE_TYPE_JPEG)); //插入图片
byteArrayOut.close();
}catch (IOException e) {
e.printStackTrace();
}
}
zhangyxh 2012-05-16
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 的回复:]

我这里有
可以读取表格
不能读图片
但是不能处理
[/Quote]

读出来的表格能不能显示?可以显示就行了,不需要编辑。
最好是能转成HTM格式的文件
daxiang253 2012-05-16
  • 打赏
  • 举报
回复
我这里有
可以读取表格
不能读图片
但是不能处理
zhangyxh 2012-05-16
  • 打赏
  • 举报
回复
有知道的兄弟姐妹帮帮忙啊。
只需要读取就行,不需要进行编辑的。
能做到尽量保留原始的格式就行,WORD的样式实在太多,又不是开源的,估计现在暂时还没有保留全部样式的办法。

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧