pdfparser和tcptf获取pdf的内容的时候会出现乱码

qq_39177602 2018-08-03 05:13:34
我想问一下有什么办法可以获取到大部分语言的字数,中文是可以获取到的但是里面的换行和其他都会占一个字节,这个有没有办法去除。还有一点是获取韩文和其他语言的时候会出现u0000\u0001\u0000N\t\u0000O\t\u0000\n\u0000\u0001\u0000C\t\u0000\"\t\u0000\u0001\u0000P\t\u000类似这样的乱码。有没有办法可以设置获取亚洲通用语言或者是cjk语言也可以~在哪里可以设置读取的语言。
...全文
485 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

21,887

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧