如何用java代码实现docx与doc格式的互转 [问题点数:100分]

Bbs1
本版专家分:0
结帖率 33.33%
Bbs1
本版专家分:20
Bbs1
本版专家分:20
Bbs1
本版专家分:0
Bbs1
本版专家分:0
Bbs1
本版专家分:0
其他相关推荐
java使用poi读取docdocx文件
这几天在学习java io流的东西,有一个网友看到博客后问了一个问题,就是说他的doc文档为什么用我所说的方法死活就是乱码。 我一开始以为是他方法问题,结果自己试了之后发现和他的结果一样也是乱码。 于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通的io流的方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确的编码格式读取了这个doc文件。
doc转换docx
doc文档中的内容复制到docx模板中,技术批量转换
java POI word的docx文档中的文字替换,并把docx转成pdf文档
最近公司的需求:替换docx文档中的指定文字(文章主题,时间等),生成新的docx文档,再把文档转换成pdf。目的是在pdf中签名使用
PDF在线转换万金油
    不少学生族和白领人士对PDF很熟悉,PDF文档不能轻易编辑,需要通过专门软件和转换格式才能修改内容,例如:把PDF转换成Word,Excel,PPT等,下载软件、安装、熟悉软件……有时候这个过程已经耗费了不少时间。如果你想快速处理PDF在线转换问题,推荐一款工具,不需要下载安装,几分钟就能完成转换。      PDF365——一个强大的PDF在线转换处理平台,不占任何的内存,打开即可使用,...
java读取txt、docdocx文件
import java.io.*; import java.io.File;   import java.io.FileInputStream;   import java.io.InputStream;   import org.apache.poi.POIXMLDocument;   import org.apache.poi.POIXMLTextExtractor;  
java利用Freemarker模板生成格式友好的doc或者docx文档
之前写过一篇利用Freemarker模板生成doc的博客,不过那个博客有点缺陷,不支持生成docx格式的文档。所以,这里补充一篇,生成docxdoc格式的文档以具体的docx模板或者doc模板为主。这里以docx为例。 具体思路: 把docx文档修改为ZIP格式(修改.docx后缀名为.zip) 获取zip里的document.xml文档以及_rels文件夹下的document.xml.r...
doc,docx,pdf,ppt等文件类型读取方法
//读取ppt文件 public String readPPT(String file) throws IOException { String re=""; InputStream is = null; try{ is = new FileInputStream(new File(file));
使用poi将doc或者docx文档处理成html进行预览
首先说下需要用到的包,spring boot项目 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.14</version> </dependency&am
文件在线预览docdocx转换pdf(一)
文件在线预览docdocx转换pdf(一) 前言 文档转换是一个是一块硬骨头,但是也是必不可少的,我们正好做的知识库产品中,也面临着同样的问题,文档转换,精准的全文搜索,知识的转换率,是知识库产品的基本要素,初识阅读时同时绞尽脑汁,自己开发?,集成第三方?都是中小企业面临的一大难题……. 自己在网上搜索着找到poi开源出来的很多例子,最开始是用poi把所有文档转换为html, 在g...
poi将word docx转化为html
jar包: //fileName文件地址public static String convert2Html(String fileName, String outPutFile) throws TransformerException, IOException, ParserConfigurationException { InputSt
POI读取.doc 和.docx的区别
一:认识POI  Apache POI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。最新的3.5版本有很多改进,加入了对采用OOXML格式的Office 2007支持,如xlsx、docx、pptx文档。  POI主页:poi.apache.org/  二:POI3.5相关下载                  3.5Jar包下载地址         
POI实现DOC/DOCX转HTML
1.使用HWPF处理DOC public class DocToHtml { private static final String encoding = "UTF-8"; public static String convert2Html(String wordPath) throws FileNotFoundException, Tra
java实现HTml转化为Doc文档
import java.io.BufferedReader; import java.io.ByteArrayInputStream; import java.io.File; import java.io.FileOutputStream; import java.io.FileReader; import org.apache.poi.poifs.filesystem.DirectoryEn
java利用Freemarker模板生成格式友好的doc文档(这种方式不支持docx)
近期做项目需要生成复杂的带格式的word文档,选择过poi和itext来文档,发现文档生成没问题,但是格式不好调,后来就想要利用freemarker模板来生成,效果还可以,今天就贴出来。 主要分为以下几步 整理一份排版友好的word文档 如: 修改word里面需要填充的文字或图片 利用$符号把要填充的内容换成具体的变量占位符 把修改后的word文档另存为xml 把生成的xml
完美解决docdocx格式word转换为Html
由于项目需要,需要在线预览文档,所以就想转换为htmL格式; 此项目为maven项目,引入的包可能需要一些时间; maven项目转换为eclipse项目命令是:mvn eclipse:eclipse,然后导入到eclipse; jar引入完成后,绝对100%能运行;
java读取word格式.doc或者.docx中的内容(APACHE POI)
需求:从word中提取手机号码首先下载Apache POI 下载地址 我下载的是二进制的文件: 解压后: 注意:为了方便我把这六个jar包都导入了eclipse里,还要把ooxml-lib里的jar包也导入,要不然会报错:java.lang.ClassNotFoundException: org.apache.xmlbeans.XmlException 所以最后导入的包为: 至此还要注意不
java docx 转换成 doc
java docx 转换成 doc. 有没有童鞋弄过,share下吧。poi不行,我看过了。
JAVA 读取 Doc、Docx 及注意点
1. 首先,是通用的读取方法: 读取doc private static String s_of_Doc(File file){ String str = ""; try { FileInputStream fis = new FileInputStream(file); HWPFDocument do...
Java 使用jacob ppt文件转pptx,docdocx;word 转html、pdf等
Java 使用jacob ppt文件转pptx,docdocx
如何通过JAVA编程实现,将PDF文件转化成Word文件( .doc或者.docx )文件
今天脑洞大开,突然想写个JAVA程序将PDF格式文件转化成Word文件(可以是.doc或者是.docx 后缀的文件),苦于没有头绪,因此请各位大师指点哈。 如果仅仅是使用pdfbox类库是否可以将PD
freemarker导出docdocx
freemarker转docdocx说明: 1.本地配置有maven环境,修改FreeMarkerUtil的main中的本地文件路径参数,然后执行main方法即可导出docx文件
批量将doc转为docx
参考网址点击打开链接
java 读取doc docx txt 文件例子
java 读取doc,docx,txt文件,代码已做了很好的封装,可以在项目中使用!有问题给我发邮箱!
DOC与DOCX的区别
可以参考一下英文文档的帮助文件 http://www.differencebetween.net/technology/protocols-formats/difference-between-doc-and-docx/comment-page-1/ 最近书写论文的时候突然发现,在docxdoc中粘贴图片时,图片的大小不一致,缩放比例也不太一致,因此,从word的结构
poi如何将doc转为docx
如题,poi如何将doc转为docx. java操作word有jacob,doc4j,poi, jacob最完美,但是效率也最低,doc4j不了解, poi用得比较多.
java能否把Word的doc文件转换成Word2007的docx文件
poi关于doc的处理不太好,获取图片,表格的位置都很难搞 所以想把doc文件转换成docx文件,所以想问一下各位有没有做过类似的处理? 或者对于doc文档的图片,表格位置的获取有没有什么好的提议?
java利用openoffice转换docdocx、txt、pptx、xlxs为PDF格式文件
1、首先安装openoffice2、安装完成后cmd  执行命令(1)cd  C:\Program Files (x86)\openoffice\program(2)soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard3、代码如下(完整工程刻在我的资源中查找名称(doc转PDF),1...
转:JAVA实现word doc docx pdf excel的在线浏览 - 仿百度文库 源码
转自:http://www.cnblogs.com/luwenbin/p/4114576.html JAVA实现word doc docx pdf excel的在线浏览 - 仿百度文库 源码 我们具体实现思路是这样的 首先下载并安装openoffice和swftools openoffice下载地址:http://www.openoffice.org/
.pdf/.doc/.docx/.xls/.xlsx/.ppt/.pptx 文件网页预览 ASP.NET MVC 项目
.pdf/.doc/.docx/.xls/.xlsx/.ppt/.pptx 文件网页预览 ASP.NET MVC 项目
用Python将doc文件批量转为docx文件
工具下载地址http://download.csdn.net/download/zzti_erlie/10177909使用指南选中输入文件夹和输出文件夹填入输入文件夹和输出文件夹即可使用,有2种填入方式,这2种填入方式的路径分隔符不一致,请勿混用。文件路径前后有空格不影响程序的运行 1. 点击右边的按钮,在弹出的对话框中选中文件即可 示例:C:/Users/Administrator/Desk
批量docdocx的两种方法--Office Migration Planning Manager使用、插件使用
批量doc文件转docx文件的两种方法方法一第一种方法直接使用Office Migration Planning Manager (OMPM)。这个工具可以批量把doc文件转为docx文件。要声明的一点,这个工具比较适合IT相关从事者使用,或者懂得一些编程技术的。因为在后面有个文件需要修改。在使用OMPM之前,你需要安装Microsoft Office Compatibility Pack(兼容性安
【Java】中常用的几种 DOCX 转 PDF 方法
DOCX2PDF 将DOCX文档转化为PDF是项目中常见的需求之一,目前主流的方法可以分为两大类,一类是利用各种Office应用进行转换,譬如Microsoft Office、WPS以及LiberOffice,另一种是利用各种语言提供的对于Office文档读取的接口(譬如Apache POI)然后使用专门的PDFGenerator库,譬如IText进行PDF构建。总的来说,从样式上利用Off
java导出docdocx
导出doc,使用itext:pom.xml中加入: com.lowagie itext 2.1.7 com.lowagi
convert doc to docx
由于项目需要,收集了各种word2003转换word2007方法,在此提供给大家。 1)You may try Aspose.Words for Java. It allows you to load a DOC file and save it as DOCX format. The code is very simple as shown below: // Open a
美解决docdocx格式word转换为Html
由于项目需要,需要在线预览文档,所以就想转换为htmL格式;  此项目为maven项目,引入的包可能需要一些时间;  maven项目转换为eclipse项目命令是:mvn eclipse:eclipse,然后导入到eclipse;  jar引入完成后,绝对100%能运行; 主要代码: package fxma.Word2Html; import java.io.Buffered
java实现word转pdf
网上有很多word转pdf的工具和代码,比如:poi, itext, jacob, openoffice, xdocreport等等 我记得还有日本一个开源工具word转pdf。 今天说说我自己项目中使用的是xdocreport真正的核心代码比较简单。先上核心代码吧。 package com.icitic.jd.common.convert; import java.io.Fil
如何使用freeMarker生成docdocx文档
java 利用freeMarker 生成docdocx、pdf文件
java导出docx文件和导出doc文件方法
一、docxdoc区别 docx是word2007出现的一个中格式doc是word2003版的一种格式docx相当于一个压缩文件,你去用压缩软件去查看   在word文件夹下面可以看到document.xml文件,要导出docx文件就要自己生成document.xml 文件自己去替换这个的文件的。但是doc不需要,这里只对docx的导出做说明。 二代码说明 在这里引用看了这个 hu...
Ubuntu下使用python读取docdocx文档的内容
读取docx文档 使用的包是python-docx 1. 安装python-docx包 sudo pip install python-docx2. 使用python-docx包读取数据 #encoding:utf8 import docx doc = docx.Document('test.docx') docText = '\n'.join([paragraph.text for pa
doc格式批量转docx
最近碰到了doc文档需要批量转为docx的需求,手工转效率太慢,经多方研究找到了一个很不错的方法: 首先,打开一个空白word,按住ALT+F11,弹出VB编程界面。因为VB提供了office的api,所以利用VB对office文件进行操作是最可靠的。在菜单栏点击插入,选择模块,即出现代码编辑框,输入下列的代码: Option Explicit Sub doc2docx() Dim sE...
将word(doc,docx)转换成html代码以及所需poi jar包
将word转换成html代码,包含docdocx格式,以及所需jar包
现在要做一个JAVA上传word,然后可以修改上传的word文件,请教大家
现在要做一个JAVA上传word,然后可以修改上传的word文件,请教大家,如何实现。
File学习3_ 用Java代码将指定目录下的doc文件转化为txt格式文档
代码如下:import java.io.BufferedWriter;import java.io.File;import java.io.FileInputStream;import java.io.FileWriter;import org.textmining.text.extraction.WordExtractor;/** * 测试将指定目录下的doc转换为txt * */public ...
如何将word转化为pdf(Java版)
前言:最近做一个项目,需要一个word转化为pdf的功能,于是自己通过在网上找各种资料。测试了好几个方法,最后决定使用jacob(Java COM Bridge)操作office的方式,主要的原因是这边word文件涉及到的内容和样式比较复杂,如果使用其他方法,例如docx4j不能够很好的处理(也可能是我没有深入研究的原因)。网上虽然已经有很多类似的教程了,有些说的很详细,但是有些说的确并不太清楚,自
Java线程与并发编程实践
Java
java 实现word转pdf
将DOCX文档转化为PDF是项目中常见的需求之一,目前主流的方法可以分为两大类,一类是利用各种Office应用进行转换,譬如Microsoft Office、WPS以及LiberOffice,另一种是利用各种语言提供的对于Office文档读取的接口(譬如Apache POI)然后使用专门的PDFGenerator库,譬如IText进行PDF构建。总的来说,从样式上利用Office应用可以保证较好的...
利用正则表达式提取docx转为txt的文件。
使用pandoc先转化docx文件。pandoc -f docx -t latex -o t33.txt testAp.docx提取出的txt格式是这样的\section{Question1}\label{question1}\subsection{问题}\label{ux95eeux9898}\begin{quote} The random variable \(X\) has the proba
判断文件是否有以.docx结尾
判断文件是否有以.docx结尾
java读取docdocx、slx、xlsx等word和excel文件
java读取docdocx、slx、xlsx等word和excel文件,方法都集合在Read类中,返回一个HTML路径,可以用在WEB开发上,功能强大
python 在linux中把doc转换为docx格式文件(支持word97和word2003)
#!/usr/bin/env python # coding:utf-8 import subprocess output = subprocess.check_output(["soffice","--headless","--invisible","--convert-to","docx","/home/requiem/workspace/python3/test.doc","--out
java word转pdf的几种方法
最近公司需要以word为模版,填充数据,然后转成pdf。做了一点点研究 1.使用xdocreport进行转(优点效率高,缺点对word格式要求较大,适合对生成pdf要求不高的情况) /** * 将word文档, 转换成pdf * 宋体:STSong-Light * * @param fontParam1 可以字体的路径,也可以是itextasian-1.5.2.jar提供的字体,比
Java word 文档Docx转Doc,或者JAVA读取Docx和Doc的方法
如题,程序运行在非Window系统下的,不能依赖微软的组件,最是有开源包,Google了好久都没找到,只好来这里求各位大侠了,在此谢谢
java使用freemarker模板导出word(docx格式;流形式输入输出)
前言:好久没有更文了,最近又再做关于导出word文档项目。其实网上很多有关导出的博文,多数是大同小异的,但是还远远不能满足我的需求。之前写过一篇导出word的文章,那个还不太成熟,随着业务的增加,肯定有了不小的变化,所以今天这篇文章索性就叫续集吧,希望可以帮到大家!上一篇写的是有关doc格式的。具体详情请访问:点击打开链接,在这里说明一下上篇存在的一些问题:1、记得上篇说到获取模板的时候,是通过n...
java 导出word 利用freemarker指令更改xml 导出word docx文档 (3)
前面两篇已经记录了导出docx 和pdf 第一篇链接:http://blog.csdn.net/rd_moon/article/details/78995563 第二篇链接:http://blog.csdn.net/rd_moon/article/details/78996664 本文主要讲导出的文档中有复杂的表格时,xml中数据复杂怎么写(xml是怎么来的在第一篇中有) 主要是利
Java 网页html转为word并保存为doc文件
首先导入POI的相关jar包。有关word操作的都导入(额,若是不清楚,就所有的导入也行)
doc/docx转html,以及wmf与emf转jpg,png图片
由于本人为此弄了许久,故多收点费用~内有源码以及相关jar包,采用的batik开源poi。
java通过模板生成docxdocx再转pdf
后面两篇对导出做出来改进以及详细操作:  第二篇:  java通过模板生成docx(2) 第三篇:java 导出word 利用freemarker指令更改xml 导出word docx文档 (3) 本篇思路:通过模板导出word doc容易,网上资料很多,大概就是将doc后缀改成xml文本打开通过freemarker指令标记${} 通过java代码动态写入。 导出do
java实现多个docx文档合并(基于docx4j)
java实现word的合并,jdk版本1.7,直接导入eclipse中即可。基于docx4j3.3.3实现。内含所有jar包,MargeDoc中含有主方法
JAVA通过模板生成DOCX文档(2)
第一篇链接 看第一篇文章会对原理更理解一些,但是比较繁琐,所以写了这一篇,怎么获取和修改xml在上一篇都有,不赘述了 import freemarker.template.Configuration; import freemarker.template.Template; import java.io.*; import java.util.Enumeration; import java
使用POI转换word doc文件
使用POI转换word doc文件 目录 1       转换为Html文件 2       转换为Xml文件 3       转换为Text文件          在POI中还存在有针对于word doc文件进行格式转换的功能。我们可以将word的内容转换为对应的Html文件,也可以把它转换为底层用来描述doc文档的xml文件,还可以把它转换为底层用来描述doc文档的xml格式的te
获取txt pdf doc docx类型文件内容
用pdfbox poi等jar包读取文件内容   由于文件可能会很大,一次性读取可能会造成内存溢出,所以分块读取。 txt逐行读取 pdf分页读取 doc docx分段读取 文件很大时,分行、分页或分段会有较大数量的行、段等,所以在分块读取时,一次读50段、50行等, 即设置一个分割数,对文件行数进行分割,得到分割后的块数和可能存在余数。   代码如下: import java
input type=file accept中限制文件类型pdf、docdocx、 jpg、 png、xls 、xlsx等格式
accept="application/msexcel,application/msword,application/pdf,image/jpeg,image/png,application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,application/vnd.openxmlformats-officedocument.wor...
Java利用jacob实现文档格式转换
实现文档格式之间的转换,我使用的是jacob-1.7版本,需要jacob.jar来调用activex控件,本机需安装WPS/office,还需要jacob.jar以及jacob.dll  其中:     jacob.dll 需要放置在系统system32下,如果系统是c盘:C://windows/system32/下面      jacob.dll放在类似这样的目录下,D:\Java
docdocx格式互转工具
从一个国外网站下载的,支持doc docx格式之间文件互转,支持批量互转,支持命令行转换,非常好用
导入(doc,docx,pdf格式)简历,doc/docx,转pdf格式,并且检索doc,docx,pdf,字段
http://java.sun.com/jsp
读取各类文件内容(doc,docx,ppt,pptx,xls,xlsx,pdf,txt等)
使用poi,pdfbox读取doc,docs,ppt,pptx,xls,xlsx,pdf,txt等各类文件内容,包含代码和jar包
浅析doc(word)格式文件内部结构
以下是在处理 .doc 文件时必须了解的一些最重要的结构。 2.1.1 WordDocument Stream Word 文档流是 .doc 文件中的主要流,其中包含文件中的所有数据(表格除外,表格存储在 1Table stream or 0Table stream中)。 File Information Block 文件信息块从 Word 文档流的偏移 0
android中解析docdocx、xls、xlsx格式文件
解析doc,要tm-extractors-0.4.jar这个包 解析xls,要jxl.jar这个包下载jxl.jar public static String readDOC(String path) { // 创建输入流读取doc文件 FileInputStream in;
Java 读写docx文件后直接转成PDF文件方法
   1.读写docx文件。需要读写docx文件需要用到poi包,等下会提供下载地址,在读写docx文件之前,需要对docx文件进行操作,打开docx文件后,再需要编辑的地方加上“:${key}”,再在java文件中通过map来对这个值进行编辑,比如map.put(key,value)docx文件内操作(注意“:”这个符号是中文的,“${}”符号是英文的): 编号:${id} 甲方(借款人):__...
JAVA使用POI操作word文档实例,兼容doc,docx(附源码)
Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。
RTF 批量转换为 DOCX 文件
RTF 批量转换为 DOCX 文件   RTF是多信息文本格式,可用于多设备、系统。最近在做一个小的数据批量处理程序时遇到了RTF格式的数据文件,这种格式虽然跨设备跨系统,但是发现解析此格式的库比较少(至少Python比较少)而且功能不全,不能实现自己获取数据文件里面的表格的需求。而对于DOCX格式的文件,其解析库就相对成熟一些!所以我需要将RTF文件转换为DOCX文件。单个文件的话,直接用wo...
使用POI将office(doc/docx/ppt/pptx/xls/xlsx)文件转html格式(附带源码)
妹子我写代码很辛苦/(ㄒoㄒ)/~~ ,转载请标明出处哦~        本项目使用poi将office文档转为html文件,使用java代码实现,移植到android处理速度很慢,请慎用        android端打开office文档可参考我上一篇文章:Android打开doc、xlsx、ppt等office文档解决方案        支持文件类型        .doc
JAVA用poi解析docdocx、slx、xlsx
JAVA用poi解析docdocx、slx、xlsx,代码我整合在一个类中,生成的是一个html,自己仔细阅读,大部分功能都能实现了,附带了POI3.8给大家
java-poi完美读写word(doc/docx)和TXT。附jar包
java-poi读.doc和.docx和TXT文件,写.doc和TXT文件。附jar包
合并DOCX文档
找了好久好久的方法,结果无意间发现了,感激上苍啊 只能合并DOCX噢,不能合并DOC,强制修改文件名后缀也是不可以的哟,所以又花了好久找上一篇文章的方法。 废话不多说,上代码,很简洁,用DOC4J。 用到的jar包有docx4j-3.3.1.jar和commons-io-2.2.jar public static void main(String[] args) { try {
POI 实现word和html互转
POI转HTML(仅针对doc): package com.vito.demo.test; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundExc
poi完美word转html(表格、图片、样式)
直入正题,需求为页面预览word文档,用的是poi3.8,以下代码支持表格、图片,不支持分页,只支持doc,不支持docx;  Java代码   /**  *   */      import java.io.BufferedWriter;  import java.io.File;  import java.io.FileInputStream;  import java.i
我们是很有底线的