itextsharp抓取PDF子串,帮我解释两行代码,谢谢

易2017 2017-10-20 02:48:13
找不到资料,中文的相关文章大多只是应用,没有解释,英文的文章翻译太费劲
 PdfReader pdfReader = new PdfReader(fileName);//读取PDF文档中内容

for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
//这几句不太理解
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);

//解释以上两句

currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));//转换编码,读取文本内容

谢谢
...全文
195 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
易2017 2017-10-27
  • 打赏
  • 举报
回复
引用 2 楼 From_TaiWan 的回复:
首先 去掉<span style="color: #FF0000;"> 去掉</span>
这是CSDN的错误,我只是想标注红色,问题在另一个贴已解决
秋的红果实 2017-10-27
  • 打赏
  • 举报
回复
去掉的,因为你复制代码时,将网页元素也复制进来了 那两句是用来读取文本的 http://blog.csdn.net/cindoralla/article/details/50945065
秋的红果实 2017-10-27
  • 打赏
  • 举报
回复
首先 去掉<span style="color: #FF0000;"> 去掉</span>

110,536

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧