求助如何通过二进制来判断DOC XLS PPT DOCX XLSX PPTX文件类型

yjip267 2014-06-28 03:25:08
ppt xls doc三种格式的文件头都是d0 cf 11 e0 a1 b1 1a e1,想知道怎么进一步识别它是哪种格式?此外,pptx xlsx docx呢?。谢谢!
...全文
6468 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
Tracy__wang 2016-03-29
  • 打赏
  • 举报
回复
楼主最后解决了么?求帮忙
hh2155399 2015-08-10
  • 打赏
  • 举报
回复
5楼的 zip的都是504B开头好吧。。 我也好奇怎么能区分docx和xlsx呢 谁有好方法帮忙提供下!
S7777777S 2015-07-31
  • 打赏
  • 举报
回复
xlsx 是 50 4B
yjip267 2014-07-01
  • 打赏
  • 举报
回复
复合文档二进制存储结构通俗讲义这个可以判断2007以下的,以上的话还没的看到资料。
yjip267 2014-06-30
  • 打赏
  • 举报
回复
谢谢上面的回答。但是对我现在没什么用。我是读每个扇区找到文件头的。但是现在想分区出来是DOC 还是XLS和PPT也不晓得文件有多大。要用二进制里面读出来。有什么好的方法。求提示…………
Rocloud 2014-06-29
  • 打赏
  • 举报
回复
http://blog.csdn.net/liangjingbo/article/details/2874959复合文档的二进制存储格式研究(word,xls,ppt...)
Rocloud 2014-06-29
  • 打赏
  • 举报
回复
轉載一些,希望對你有參考價值 简单的说,在doc中,微软还是用二进制存储方式;在docx中微软开始用xml方式,docx实际上成了一个打包的压缩文件(经众多知友确认,为zip方式压缩)。 到目前为止,查看 Microsoft Office 二进制文件的最简单方法是使用创建该文件的主机程序。例如,通过使用 Word 查看 .doc 文件,或使用 PowerPoint 查看 .ppt 文件。该方法可向用户显示内容的视图,如文本、格式和用户界面的一般状态。 您可以使用 Office 可视化工具 offvis.exe 获得结构更清晰的二进制文件视图。通过下面的链接,您可以直接从下载中心下载此工具:http://download.microsoft.com/download/1/2/7/127BA59A-4FE1-4ACD-BA47-513CEEF85A85/OffVis.zip(该链接可能指向英文页面)。将任何 Microsoft Office 二进制文件加载到可视化工具中时,您会看到两个窗格。导航窗格显示原始文件内容,每行均显示当前偏移量、一个十六进制数字链,及其文本表示形式(如果有)。结果窗格显示包含当前数据结构的名称、值、偏移位置、大小和类型的分析结果。下面的屏幕截图显示可视化工具中包含"Hello, world"文本的 .doc 文件的一部分。其中选择了字母"w"。这会导致可视化工具突出显示相应的十六进制数字和数据结构。

9,506

社区成员

发帖
与我相关
我的任务
社区描述
Windows专区 安全技术/病毒
社区管理员
  • 安全技术/病毒社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧