复合文档的二进制存储格式研究(word,xls,ppt.)前 言 复合文档(Compound Document)是一种不仅包含文本而且包括图形、电子表格数据、声音、视频图象以及其它信息的文档。可以把复合文档想象成一个所有者,它装着文本、图形以及多媒体信息如声音和图象。目前建立复合文档的趋势是使用面向对象技术,在这里,非标准信息如图像和声音可以作为独立的、自包含式对象包含在文档中。Microsoft Windows就是使用这种技术,叫做“OLE2 storage file format”或“Microsoft Office compatible storage file format”。当然Excel、Word等都是用这种格式存储的。本文主要研究复合文档的二进制结构。目 录第一章 仓库与流(Storages and Streams)第二章 扇区与扇区链(Sectors and Sector Chains)第三章 复合文档头(Compound Document Header)第四章 扇区