社区
Web 开发
帖子详情
java 读取pdf问题
wangdawei722
2009-11-04 09:43:17
假如 有个pdf文件 里面的内容是:
姓名:wdw 出生年月:1985/1/1
在网上看了很多用PDFBox来读取,可是都是把全部内容都读取出来的
现在要求只读取其中的 wdw 和 1985/1/1
固定的那些 姓名和出生年月就不用读取了!
可以实现吗? 还望高人指点一下!
...全文
140
17
打赏
收藏
java 读取pdf问题
假如 有个pdf文件 里面的内容是: 姓名:wdw 出生年月:1985/1/1 在网上看了很多用PDFBox来读取,可是都是把全部内容都读取出来的 现在要求只读取其中的 wdw 和 1985/1/1 固定的那些 姓名和出生年月就不用读取了! 可以实现吗? 还望高人指点一下!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
17 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
youjianbo_han_87
2009-11-04
打赏
举报
回复
pdfbox试试。
wangdawei722
2009-11-04
打赏
举报
回复
还有人能顶一下吗?
wangdawei722
2009-11-04
打赏
举报
回复
这样的格式让我怎么去过滤啊?
头疼啊
wangdawei722
2009-11-04
打赏
举报
回复
哎……
我也这么想过啊!
可惜pdf内容是日文啊!
读取出来的纯文本如下:
出力日 2009/10/20 15:40:28
【楽天市場】※注意※ これは受注管理などに使用する店舗様向けの帳票です。お客様にお送りにならないよう、お気をつけください。
■ 受注管理情報 購入日時 2009年10月20日 4時15分 受注番号 250334-20091020-49094121
発送日 入金日
ひとこと
メモ
■ 注文者 氏名 斎田 健一郎(サイタ ケンイチロウ)
住所 〒 986-0011 宮城県石巻市湊字御所入105-1
電話番号 080-1827-7845
■ 支払い情報 請求金額 143 円 総合計 2,570 円
ポイント利用方法 全て ポイント利用額 -2,427 円
お支払方法 クレジットカード 一括払い【VISA】
■ 配送情報 配送方法 宅配便(西濃運輸カンガルー便)
配送区分
お届け日指定 お届け時間帯
受注明細票 決済方法 配送方法 送付先 ギフト
ク 宅
■ 送付先 氏名 斎田 健一郎(サイタ ケンイチロウ)
住所 〒 986-0011 宮城県石巻市湊字御所入105-1
電話番号 080-1827-7845
のし 発送番号
■ 備考 [配送日時指定:]
9:00〜12:00
■ 明細
商品名/商品番号/項目:選択肢 個数 単価 小計
サマーセール「メンズ」吸汗速乾・Tシャツ・半袖 22008
サイズ:LL(XL) カラー:グレー 2 480 円 960 円
サマーセール「メンズ」吸汗速乾・Tシャツ・半袖 22008
サイズ:LL(XL) カラー:ブラック 2 480 円 960 円
合計 消費税 送料 代引き手数料
1,920 円 0 円 650 円 0 円
総合計 ポイント利用額 請求金額
2,570 円 -2,427 円 143 円
junkor
2009-11-04
打赏
举报
回复
貌似就是楼上说的,毕竟pdf不是xml,不能识别标签,只能对内容进行过流了。。。。。
xtbzqw
2009-11-04
打赏
举报
回复
你可以先全部读取,然后对读取的内容进行过滤提取啊,这样做会简单许多啊!
heyi10012
2009-11-04
打赏
举报
回复
这样控制有些难,你只能一个一个的控制,只读取“:”后的几位
wangdawei722
2009-11-04
打赏
举报
回复
呵呵,郁闷了。
现在的项目要求就是把PDF文件中的数据读取出来
自动填写到表单当中去!
哎……
liguominz
2009-11-04
打赏
举报
回复
貌似只能读全部,没见过楼主这样的读法的
呵呵~关注下~
97095639
2009-11-04
打赏
举报
回复
好像不可以
invoked
2009-11-04
打赏
举报
回复
关注
wangdawei722
2009-11-04
打赏
举报
回复
很有才,字符串截取成功了!
谢谢各位啊!
fige168
2009-11-04
打赏
举报
回复
good
yonghenghxq
2009-11-04
打赏
举报
回复
路过学习
阿_布
2009-11-04
打赏
举报
回复
你就找到日文里面'姓名'对应的是哪个,' 出生年月'对应的是哪个,跟中文一样的找啊!
全部读出来,再对字符串进行截取。
zhoushijin5201314
2009-11-04
打赏
举报
回复
貌似就是楼上说的,毕竟pdf不是xml,不能识别标签,只能对内容进行过流了。。。。。
道光2008
2009-11-04
打赏
举报
回复
字符串截取嘛
java
读取
PDF
文件中的内容
java
读取
PDF
文件中的内容
java
读取
PDF
文件中的内容
JAVA
上传下载
JAVA
代码
输入流表示从一个源
读取
数据,输出流表示向一个目标写数据。
Java
为 I/O 提供了强大的而灵活的支持,使其更广泛地应用到文件传输和网络编程中。 但本节讲述最基本的和流与 I/O 相关的功能。我们将通过一个个例子来...
java
源码包---
java
源码 大量 实例
Java
存储与
读取
对象 1个目标文件 如题
Java
调色板面板源代码 1个目标文件 摘要:
Java
源码,窗体界面,调色板 使用
Java
语言编写的一款用于反映颜色变化的面板,也就是大家熟悉的颜色调色板演示程序。原理是初始化颜色...
java
源码包2
Java
存储与
读取
对象 1个目标文件 如题
Java
调色板面板源代码 1个目标文件 摘要:
Java
源码,窗体界面,调色板 使用
Java
语言编写的一款用于反映颜色变化的面板,也就是大家熟悉的颜色调色板演示程序。原理是初始化...
Web 开发
81,091
社区成员
341,719
社区内容
发帖
与我相关
我的任务
Web 开发
Java Web 开发
复制链接
扫一扫
分享
社区描述
Java Web 开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章