关于提取PDF文档中文字的坐标,大小信息

没有黑科技 2017-11-01 03:38:23
如何正确的在窗口上显示pdf中文本的位置和大小,从某PDF文件中提取到如下文本信息

BT
/F1 13.68 Tf
0.0 0.0 0.0 rg
1.0 0.0 0.0 1.0 186.48 592.32 Tm
[<4609>-87<1C5F>-87<045A>-3526<2CB4>-87<07BC>-1087<01C4>] TJ
ET

从Tm中可以获取这组字符串的起始坐标即首个文字的坐标(186.48, 592.32)。
之后的文字要正确的显示出来的话坐标要如何提取?
也不能将这组字符串直接显示,因为其中有间距调整-87,-3526之类的,
求如何精确的在屏幕上显示这组字符串每个文字的位置?
...全文
1058 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
赵4老师 2017-11-02
  • 打赏
  • 举报
回复
参考RTF?
sky821305 2017-11-02
  • 打赏
  • 举报
回复
引用 3 楼 WSonGG 的回复:
[quote=引用 2 楼 sky821305 的回复:] LZ提取pdf中的文本内容应用的是什么方法?xpdf吗
没有借助其他库,直接读取PDF文档中的内容,解压流对象后就会有图片,文字信息[/quote]得到的文字信息是pdf中的文本内容吗?
没有黑科技 2017-11-02
  • 打赏
  • 举报
回复
引用 2 楼 sky821305 的回复:
LZ提取pdf中的文本内容应用的是什么方法?xpdf吗
没有借助其他库,直接读取PDF文档中的内容,解压流对象后就会有图片,文字信息
sky821305 2017-11-02
  • 打赏
  • 举报
回复
LZ提取pdf中的文本内容应用的是什么方法?xpdf吗

64,683

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧