Office (2007) Open XML 文件格式简介【转载】

发布日期: 2007-07-06 | 更新日期: 2007-07-06

Frank Rice, Microsoft Corporation

学习Office Open XML格式的优势。用户可以在Office应用程序和企业系统之间使用XML和ZIP技术来交换数据。文档是全局可以访问的。并且,您还可以减少文件损坏的风险。

适用于: 2007 Microsoft Office 套件,Microsoft Office Excel 2007,Microsoft Office PowerPoint 2007,Microsoft Office Word 2007

*
本页内容
Office Open XML 文件格式简介 Office Open XML 文件格式简介
新的文件格式应用场景 新的文件格式应用场景
新的文件格式的优势 新的文件格式的优势
Office Open XML 格式的术语列表 Office Open XML 格式的术语列表
Office XML 格式的结构 Office XML 格式的结构
使用Office XML 格式开发解决方案 使用Office XML 格式开发解决方案
在Office产品中使用新的文件格式 在Office产品中使用新的文件格式
修改 Office XML 文件格式来自定义用户界面 修改 Office XML 文件格式来自定义用户界面
结论 结论
相关资源 相关资源

Office Open XML 文件格式简介

随着20世纪90年代XML的出现,企业计算客户开始逐渐认识到,在他们所依赖的计算机产品和应用中采用开放的格式和标准所带来的商业价值。IT专业人员将从通用的数据格式中受益匪浅,这种格式可能是XML,因为它拥有被应用程序、平台和Internet浏览器读取的能力。

同样,随着在Microsoft Office 2000中对于XML格式的支持与采用,开发人员开始认识到,他们需要将以前的Microsoft Office版本中的二进制文件格式转换为XML格式。二进制文件(.doc,.dot,.xls,以及.ppt文件)在过去几年中一直肩负着存储和转换数据的重任,而现在它们无法满足新的市场需求的挑战,其中包括轻松地在异构应用之间传递数据,以及允许用户从这些数据中搜集商业信息。

2007 Microsoft Office system为Microsoft Office Excel 2007,Microsoft Office Word 2007,和Microsoft Office PowerPoint 2007采用了基于XML的文件格式,从而延续了这种转移。新的文件格式,称为Office Open XML格式,解决了上述市场需求的问题,同时改变了您基于Microsoft Office文档建立解决方案的方式。

新的格式增强了文件与数据的管理能力,数据恢复能力,以及与业务线系统的互操作能力。它们是对早期版本的二进制文件的扩展。任何支持XML的应用程序都可以访问新文件格式当中的数据,并与之协同工作。这些应用程序并不需要成为Microsoft Office system或Microsoft产品的一部分。用户也可以使用标准的转换来提取或重新组织数据。另外,有关安全性的担忧也大大的降低,因为信息是存储在XML当中的,它从本质上来讲都是纯文本的。因此,数据可以没有任何障碍地通过企业防火墙进行传递。

注意:

不要将Office Open XML格式与Microsoft Windows XML Paper Specification格式相混淆。Office Open XML格式使用Open Packaging ConventionsXML Paper Specification (XPS)也使用它。但是,这两种格式在许多重要的方面是不同的。XPS是一个页面内的,固定的文档格式,它是在Microsoft Windows Vista操作系统当中所引入的。而Office Open XML格式是面向Office Word 2007,Office Excel 2007,和Office PowerPoint 2007的完全可编辑的文件格式。虽然它们在XML和ZIP压缩的使用方面有很多相似的地方,但是它们在文件格式的设计和使用目的上还是有着很大的不同。

新的文件格式应用场景

Office Open XML文件格式改变了客户处理数据的方式。对于下面的一些场景,新的文件格式使之变为可能:

一个服务器端的过程可以从一个ZIP压缩包中读取其中一项,而无需将它们所有的内容解压。例如,您可以只提取文档的数据中包含的XML文件,而不需要打开包含文档的格式、属性和其它辅助信息的文件。

在更多场景中,新的文件容器对于用户来说是透明的。它看上去就像一个传统的二进制文档文件。但是,新的XML格式文档是经过压缩的,所以更小,从而也更便于在其它用户之间通过电子邮件或其它方式进行发送。

杀毒软件和服务器应用程序都可以更加方便的提取容器里的内容,从而直接查看影响的项,而不需要破坏整个容器或者里面的内容。

文件可以以新的文件格式保存,而不包含可执行的宏代码。(如果希望保存的话,可以选择启用宏的文件格式,相关内容会在本文的后面进行讨论。)因此,它们可以被认为是十分安全的,并且可以通过防火墙进行传输,或者通过电子邮件进行发送,而不需要考虑安全性的问题。这种行为是由Microsoft Office应用程序所强制的。如果一个宏被添加到了一个Office Open XML格式的文件当中,那么Office将不允许这种文档的打开。

注意:

一些ZIP应用程序允许你创建加密的文件。新的文件格式不能创建加密的文件。如果你企图读取一个加密的文件,那么它将会停止文件的读取并返回一个错误。

如果容器中的一项损坏了,那么其它的项还是可用的。例如,如果一个用户尝试打开一个损坏了的磁盘上的损坏了的文件,那么Office文件恢复机制将重新建立中心目录,并完全恢复文件的内容。

Office的开发人员可以使用Microsoft WinFX应用程序编程接口(API)来创建一个有效的XPS文件。这些API可以帮助你建立解决方案,并与新的文件格式进行交互。如果一个由其它ZIP应用程序创建的ZIP压缩包没有使用特定的ZIP功能,那么Office的开发人员也可以使用API来打开它。

注意:

Microsoft Office创建的文件符合Open Packaging Conventions,所以WinFX API可以进行读取,相反的,WinFX也可以创建一些包,允许您使用Microsoft Office 应用程序来打开它们。WinFX API可以与Microsoft Windows的以前版本协同工作,包括:Microsoft Windows Vista,Microsoft Windows Server 2003,和Microsoft Windows XP。另外,转换器对于Microsoft Office 2000,Microsoft Office XP,和Microsoft Office 2003版本也是可用的。

新的文件格式也改变了Office用户使用那些用来处理日常事务的应用程序的方式,下面的场景描述了一些新的格式所带来的工作方式上的改变,这些任务都是通常使用2007 Office来完成的:

Howard,是一个好奇心很强的用户,他发现2007 Office版本中包含的新的文件格式是一个ZIP文件。Howard希望自己亲自看一看,因此他使用一个ZIP应用程序打开了一个在Word 2007中创建的文档。它看到了一些文件,好像都是XML文档的内容,还有一些图片正是他在原始的文档中看到过的图片。于是,好奇的Howard在记事本中打开了一个XML文件,想看看Word生成的XML文件的格式是什么样的。在了解了压缩包中的文件结构后,他关闭了记事本和ZIP应用程序,重新在Word中打开文件并继续他的文档处理工作。

Jan需要改变她的Word 2007文档的一个文档属性。她在一个ZIP应用程序中打开了新的格式文件,它提取了其中包含文档属性的XML项,做出了一些更改,然后又把这一项添加回原来的容器,然后保存并关闭容器。然后,她又在Word中打开了文档,她发现所有的内容都没有改变,而只有那么需要改变的属性被她修改了。

一个顾问公司的logo需要进行改变,从而反应他们的新目标。IT部门接到了这个改变成千上万的文件中所有logo的任务,这些文档都被保存在一个服务器当中。在以前版本的Microsoft Office应用程序中,他们必须单独打开每个文档,删除原有的logo,并且粘贴新的logo,或者创建并且测试一个相当复杂的应用程序,来自动的执行这个任务。通过新的文件格式,IT部门创建一个批处理过程来浏览文件的格式,并且在meida目录中定位图片的位置(这对于每个文档都是一样的),并且替换为新的图片。现在,当打开新的文档后,新的logo就自动的显示出来了。

一个法律公司必须保护客户的机密数据,以及他们自己的数据。基于标准的实践,公司了解到创建使用Word所创建的一些文档存储了许多属性 - 有些是可见的,而有些则是在文档中不可见的。其中一些属性可能会包含客户的敏感信息或者企业的机密信息。通过不断的尝试和失败。公司创建一个程序来删除这些信息。但是,这个程序非常耗时,并且因为它独立于用户,所以经常会出现错误。通过使用新的文件格式,IT部门的开发人员开发了一个简单的批处理程序,它在文档的压缩包中浏览整个目录结构从而删除指定的部件。公司现在可以保护所有的客户敏感信息和机密信息,并将它们从文档中删除掉。

Denise正在对她的硕士学位的毕业论文做出最后的修改。在添加完参考文献后,它准备进行最后的保存。这时,恐怖的事情发生了,在保存文档的时候发生了意外停止,并且她收到了文档可能损坏的消息。在她就要崩溃的时候,她突然想到她使用的是新的文件格式。于是,她将文本导出到一个新的文档中,重新附加图片,并且引入格式和样式部分,从而成功的重新构造文档。然后,她保存了新的文档。

Elizabeth是一个Windows 2000用户,它正在使用Office 2000,其中安装了转换器来打开2007 Office的文档。她可以打开了一个Word XML格式的文档。另外,她可以编辑文档,并且重新将它保存为新的文档格式,因为转换器提供了打开和保存的支持。

新的文件格式的优势

新的Office Open XML格式带来了一系列的优势,它不但可以帮助开发人员建立解决方案,而且可以帮助最终用户和所以规模的企业。

下面列出了一些Office Open XML格式所带来的总体上的优势:

简单将商业信息与文档相集成。Office Open XML格式允许快速地从数据源创建文档,加速文档的装配件,数据挖掘和内容的重用。Office应用程序和企业业务系统之间的数据交换得到了简化。另外,您可以更改Office文档中的信息,或者使用非Office应用程序通过文档容器的方式来创建文档。企业员工可以在所有支持XML读写的应用程序当中,通过更加快速准确地发布、搜索、和重用信息,从而提高他们的生产效率。

开放并且是免税的。Office Open XML格式是基于XML和ZIP技术的,因此它们可以随便地使用。格式和架构的详细标准说明将会发布出来,并且会处于与现在已经存在的Microsoft Office 2003引用的架构相同的免税条约下,并且它是开放使用的,可以用于生产用途。

互操作性。Office Open XML格式是以工业标准的XML为核心的,Microsoft Office应用程序与企业业务系统之间的数据交换得到了简化。无需访问Office应用程序,解决方案就可以更改Office文档当中的信息,或者使用标准的处理XML的工具和技术来创建文档。新的格式允许您构建文档的存档,而无需使用Office的代码。

健壮性。Office Open XML格式被设计为比二进制格式更加健壮,而且因此可以帮助降低由于文件损坏所带来的信息丢失的风险。即使在Office外面对于文档的修改和创建也不会对文档造成过多的损坏,因此使用新的文件格式,Office应用程序被设计为使用增强的可靠性来恢复文档。随着越来越多的文档穿梭与电子邮件的附加或可移动的存储设备之间,网络或存储设备的损坏增加了文档损坏的可能性。

新的文件格式通过将文档在文件包中进行分段单独的存储,增强了数据恢复的能力。这将大大的节省企业用于恢复数据丢失所花费的大量资金和时间。当一个文件组件损坏时,文件中的剩余部分还可以在应用程序中打开。例如,如果一幅图表被损坏了,这也并不能阻止客户打开文档中的其它部分,当然不包括图表。另外,Office应用程序可以检测这些问题,并且在打开文档的时候尝试修复它,恢复文档正确的数据结构。

高效性。Office Open XML格式使用ZIP和压缩技术来存储文档。这种新格式的一个巨大的优势就在于它的文件大小非常小 - 最大的压缩比可以达到原来二进制文件的百分之75。这是使用XML和ZIP技术结合进行文件存储的一大优势。因为XML是一个基于文本的格式,所以压缩的比率非常的好,而且ZIP容器支持内容的压缩,所以用户可以大大的减小文件的尺寸。文件压缩的类型提供了潜在的成本节约,因为它减少了存储文件所需的磁盘容量,并且减少了通过电子邮件、网络和Web进行文件传输所需的带宽。

安全性。Office Open XML的开放性使得它更加的安全。您可以保密的共享文档,因为您可以简单的确认并删除一些个人信息或者是商业机密信息,例如用户名、注释和文件路径。类似的,你可以确定文件包含的内容,例如OLE对象或者Microsoft Visual Basic for Applications (VBA)代码,从而进行特殊的处理。文件格式也可以帮助提高安全性,防止文档中保存嵌入的代码或宏。默认情况下,新的Word 2007,Excel 2007和PowerPoint 2007的文件格式不包含嵌入的可执行代码。因此,如何一个人发送了一封电子邮件,其中包含了一个Word文档作为附件,他或她可以打开文档并且不会执行任何潜在的有害可执行代码。Office Open XML格式包含一种特殊用途的格式,它拥有一个单独的扩展名,其中可以包括嵌入的代码,这样就允许IT员工快速的判断文件中是否包含代码。

向后兼容性。2007 Microsoft Office system是向后兼容的,它可以兼容早期的版本:Microsoft Office 2000,Microsoft Office XP,和Microsoft Office 2003.这些版本的用户可以采用新的格式,或者继续使用现有的文件格式。特别地,他们可以继续使用原有的.doc,.xls,和.ppt的二进制格式的文件,它们与2007的文件格式是完全兼容的。早期Office版本的用户可以下载一个免费的更新,它允许您在他们早期的版本中打开和编辑这种新格式的文件。那些安装2007 Office版本的用户可以将默认的文件格式设定为他们需要的一种格式。这样可以帮助确保用户继续与基于早期版本的第三方解决方案协同工作,并且与他们的同事、提供商、客户和其它已经升级的用户协同工作。

全文请参考

http://www.microsoft.com/china/msdn/library/office/office/OfficeOpenXMLFormats.mspx?mfr=true

原文地址:https://www.cnblogs.com/chenxizhang/p/1359818.html