关于提取PDF文档中文字的坐标,大小信息

不二师兄 软件开发  2017-11-01 03:38:23
如何正确的在窗口上显示pdf中文本的位置和大小,从某PDF文件中提取到如下文本信息

BT
/F1 13.68 Tf
0.0 0.0 0.0 rg
1.0 0.0 0.0 1.0 186.48 592.32 Tm
[<4609>-87<1C5F>-87<045A>-3526<2CB4>-87<07BC>-1087<01C4>] TJ
ET

从Tm中可以获取这组字符串的起始坐标即首个文字的坐标(186.48, 592.32)。
之后的文字要正确的显示出来的话坐标要如何提取?
也不能将这组字符串直接显示,因为其中有间距调整-87,-3526之类的,
求如何精确的在屏幕上显示这组字符串每个文字的位置?
...全文
665 4 点赞 打赏 收藏 举报
写回复
4 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
赵4老师 2017-11-02
参考RTF?
  • 打赏
  • 举报
回复
sky821305 2017-11-02
引用 3 楼 WSonGG 的回复:
[quote=引用 2 楼 sky821305 的回复:] LZ提取pdf中的文本内容应用的是什么方法?xpdf吗
没有借助其他库,直接读取PDF文档中的内容,解压流对象后就会有图片,文字信息[/quote]得到的文字信息是pdf中的文本内容吗?
  • 打赏
  • 举报
回复
不二师兄 2017-11-02
引用 2 楼 sky821305 的回复:
LZ提取pdf中的文本内容应用的是什么方法?xpdf吗
没有借助其他库,直接读取PDF文档中的内容,解压流对象后就会有图片,文字信息
  • 打赏
  • 举报
回复
sky821305 2017-11-02
LZ提取pdf中的文本内容应用的是什么方法?xpdf吗
  • 打赏
  • 举报
回复
相关推荐
发帖
C++ 语言
加入

6.0w+

社区成员

C++ 语言相关问题讨论,技术干货分享,前沿动态等
申请成为版主
帖子事件
创建了帖子
2017-11-01 03:38
社区公告
暂无公告