怎么读取PDF文件内容才不是乱码
Cosmo 2013-10-08 05:41:52 PDDocument doc = PDDocument.load(file.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));
swPdfChange.Write(text);
swPdfChange.Close();
这种方式能读出来中文。但不能保存到数据库中,因为内容太长了。
我想通过二进方式保存但读出来后都是乱码
FileStream f = new FileStream(string.Format(strFilePath, strFileName), FileMode.Open, FileAccess.Read);
BinaryReader br = new BinaryReader(f);
byte[] buffer = br.ReadBytes(Convert.ToInt32(f.Length));
return buffer;