PDF文件读取报错!'UniGB-UCS2-H'
读取主要代码如下:
in = new FileInputStream(fileName);
PDFParser parser = new PDFParser(in);
parser.parse();
PDDocument pdfdocument = parser.getPDDocument();
PDFTextStripper stripper = new PDFTextStripper();
String result = stripper.getText(pdfdocument);
content=result;
System.out.println("PDF文件的文本内容如下:");
System.out.println(result);
报错信息:java.io.IOException: Unknown encoding for 'UniGB-UCS2-H'
但是:读取文件为我自己用代码生成的pdf文件。若使读取是其他非生成文件则没有问题:
生成PDF文件代码如下:是不是生成文件的设置漏掉了什么。。。求各位大神解决啊~~
doc = new Document();
doc.setPageSize(PageSize.A4);
PdfWriter.getInstance(doc, new FileOutputStream(outpath+pdfFilename+".pdf"));
System.out.println(outpath+pdfFilename+".pdf");
BaseFont baseFont = BaseFont.createFont("STSong-Light",
"UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
Font font=new Font(baseFont);
doc.open();
if((docstr != null) ){
doc.add(new Paragraph(docstr,font));
flag.append("Normal");
}