社区
C#
帖子详情
提取pdf文本信息
codeworker999
2007-07-31 03:05:24
有谁搞过pdf文件的格式分析啊
一起来讨论下,RT
...全文
329
11
打赏
收藏
提取pdf文本信息
有谁搞过pdf文件的格式分析啊 一起来讨论下,RT
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
stgu14
2012-07-23
打赏
举报
回复
http://www.ebsyy.cn/download
lddwww
2011-09-30
打赏
举报
回复
用pdfbox解析。
tianxinzhe032
2007-08-23
打赏
举报
回复
我用了pdfbox 不过好象对一些中文编码支持有点问题
icscs
2007-08-09
打赏
举报
回复
参考:
向PDF中添加图片和圆角文本框等元素
http://bbs.msproject.cn/default.aspx?g=posts&t=258
虽然是写入,不过其中分析的格式同样适用于读出
kingonehappy
2007-08-08
打赏
举报
回复
关注 帮顶 收藏
njlhb
2007-08-08
打赏
举报
回复
用Itextsharp,你到网上去搜一下,有这个开源代码的
codeworker999
2007-08-01
打赏
举报
回复
迷人出来哦
love_1980
2007-07-31
打赏
举报
回复
支持一下!
codeworker999
2007-07-31
打赏
举报
回复
想知道文本定位信息除了TD,TM还有哪些?
怎么确定位置?
liusong_china
2007-07-31
打赏
举报
回复
帮顶
codeworker999
2007-07-31
打赏
举报
回复
自己顶一下
C++程序读取
PDF
中的
文本
Adobe允许你提交
PDF
文件,
提取
成
文本
或HTML后再通过邮件发送给你。但是假如你需要自己
提取
文本
或在程序中加入这个功能的话,需要花费很多时间。也许你还需要对
文本
应用某些特殊格式(如,添加tab分隔符)以便它们...
免费
PDF
控件Spire.
PDF
除了基本的功能比如:绘制多种图形,图片,创建窗体字段,插入页眉页脚,输入数据表,自动对大型表格进行分页外,Spire.
PDF
for .NET还支持
PDF
数字签名,将HTML转换成
PDF
格式,
提取
PDF
文档中的
文本
信息
和图片,存为...
论文相似性检测工具(论文查重软件)
系统采用自研的QingQing算法
提取
信息
指纹,在P3、512MBPC上,分词速度为13MB/S,已在互联网提供评测版供业内评测。 3.引文及参考文献去除,使得误判的可能性降至最低。 4.分块检测机制,将文章的每一
文本
块与其他...
python第三方库
提取
PDF
文本
信息
这个库的优点是安装简便,但是虽然可以准确
提取
出文件内的
文本
信息
,但会把一行
文本
内的每个单词打断成多行,甚至把完整的单词也切割开来,识别精度不是很高。官方说明很详细,但是使用起来略微有些复杂,需要仔细看...
java
提取
文字内容_Java
提取
PDF
文本
内容
概述一般来说,我们无法对
PDF
文档格式的内容进行修改编辑,但当我们确有此需求时,可通过
提取
文本
内容的方式来实现。...
提取
PDF
文档中的所有
文本
内容
提取
PDF
指定页面的
文本
内容
提取
PDF
指定区域的
文本
内容Jar包的获...
C#
110,538
社区成员
642,577
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章