新手请教高手一个问题,关于pdf转换html的问题!

copyday 2010-11-02 12:16:17
我看了这个帖子http://www.javaeye.com/topic/333676 说是可以实现pdf转换成html,
我目前也确实实现了转换,但是只局限于英文的pdf,中文的就不行了,转换后的html一片空白,。很困惑,,,
我的代码如下:


import java.io.File;
import java.io.IOException;


public class ConvertPdf
{
private static String INPUT_PATH;
private static String PROJECT_PATH;

public static void convertToHtml(String file, String project)
{
INPUT_PATH = file;
PROJECT_PATH = project;
if(checkContentType()==0)
{
toHtml();
}
}

private static int checkContentType()
{
String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length())
.toLowerCase();
if (type.equals("pdf"))
return 0;
else
return 9;
}

private static void toHtml()
{
if(new File(INPUT_PATH).isFile())
{
try
{
String cmd = "cmd /c start c:\\xpdf\\pdftohtml.exe -enc UTF-8 \"" + INPUT_PATH + "\" \"" +PROJECT_PATH+ "\"";
Runtime.getRuntime().exec(cmd);
}
catch (IOException e)
{
e.printStackTrace();
}
}
}

public static void main(String[] args)
{
ConvertPdf cpdf=new ConvertPdf();

ConvertPdf.convertToHtml("C:\\o.pdf", "c:\\b.html");
}

}



我感觉不是代码的问题,有可能是配置的问题,有个中文的配置文件,我我不知道该如何配置!!! 文件如下:

#----- begin Chinese Simplified support package
cidToUnicode Adobe-GB1 xpdf-chinese-simplified\Adobe-GB1.cidToUnicode
unicodeMap ISO-2022-CN xpdf-chinese-simplified\ISO-2022-CN.unicodeMap
unicodeMap EUC-CN xpdf-chinese-simplified\EUC-CN.unicodeMap
unicodeMap GBK xpdf-chinese-simplified\GBK.unicodeMap
cMapDir Adobe-GB1 xpdf-chinese-simplified\CMap
toUnicodeDir xpdf-chinese-simplified\CMap
fontDir C:\WINDOWS\Fonts
displayCIDFontTT Adobe-GB1 C:\WINDOWS\Fonts\simhei.ttf
#----- end Chinese Simplified support package


谢谢各位老大,小弟感激不尽 呵呵
...全文
135 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
copyday 2010-11-03
  • 打赏
  • 举报
回复
没人了吗 我可以再加分。。两天了
copyday 2010-11-02
  • 打赏
  • 举报
回复
这个问题确实比较困难。。

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧