请教:word文档的二进制流格式是什么样的?

zasdfaaa 2009-10-13 02:38:33
hi,大家好,
我想解析word文档内容,我查阅了好多资料,但是还是没有找到好用的信息。我看了下msdn里面的帮助文档,也看了文档MICROSOFT OFFICE WORD 97-2007 BINARY FILE FORMAT SPECIFICATION。
我读取word流,然后将每一个字节内容写入了文件来查看信息。我发现我得到的内容跟msdn里面的描述就没对上一个。
D0~~CF~~11~~E0~~A1~~B1~~1A~~E1~~0~~~0~~~0~~~0~~~0~~~0~~~0~~~0~~~
0~~~0~~~0~~~0~~~0~~~0~~~0~~~0~~~3E~~0~~~3~~~0~~~FE~~FF~~9~~~0~~~
比如文档中说FibBase.wIdent (2 bytes): An unsigned integer that specifies that this is a Word Binary File. MUST be 0xA5EC.,可是我得到的是0xCFD0(小字节序)

请问大家,word格式究竟是什么样的?msdn上的文档被我读错了吗?
谢谢大家
...全文
714 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
_大傻瓜_ 2011-03-11
  • 打赏
  • 举报
回复
我也正在研究这个word格式,不过我就很不成了!我现在能把整个目录中的流入口都找到,然后通过扇区配置表找到了整个流,但是流里边就解析不了!!
zasdfaaa 2009-10-19
  • 打赏
  • 举报
回复
sorry,这两天忙,我给忘记了。
给分。
再次感谢河马
liujiaqiid 2009-10-15
  • 打赏
  • 举报
回复
学习....
zasdfaaa 2009-10-14
  • 打赏
  • 举报
回复
十分感谢河马。分明天全给您。
想必您对word等文件格式比较有研究喽,今后还要向您请教,还请不吝赐教。
请问您上csdn看站内短信吗?
arong1234 2009-10-14
  • 打赏
  • 举报
回复
个人觉得凭借个人力量去搞这个不值得
bigriverhorse 2009-10-14
  • 打赏
  • 举报
回复
我不太清楚的你目标是什么,似乎是想写一个Word的解析程序,如果是这样的话,我建议你去看看abiword源代码就可以了。
bigriverhorse 2009-10-14
  • 打赏
  • 举报
回复
对于头部,楼主应该看另外一个文档,地址如下,下面红色部分就是楼主想要看到的。

http://download.microsoft.com/download/0/B/E/0BE8BDD7-E5E8-422A-ABFD-4342ED7AD886/WindowsCompoundBinaryFileFormatSpecification.pdf

2.1 Header

struct StructuredStorageHeader { // [offset from start in bytes, length in bytes]

BYTE _abSig[8]; // [000H,08] {0xd0, 0xcf, 0x11, 0xe0, 0xa1, 0xb1, 0x1a, 0xe1} for current version,
zasdfaaa 2009-10-14
  • 打赏
  • 举报
回复
我解析了一下这个文档,弄好了fib信息,但是跟msdn上的格式还是有些出入,唉。不爽啊,这么搞下去,真不知道是否能把这个程序写出来,没信心啊。

河马还有其他高人是否有什么其他文档信息提供一下。
谢谢。
liujiaqiid 2009-10-13
  • 打赏
  • 举报
回复
lz 你想真么读取word流?? 用vba?

5,172

社区成员

发帖
与我相关
我的任务
社区描述
其他开发语言 Office开发/ VBA
社区管理员
  • Office开发/ VBA社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧