Possible Duplicate:
Reading/Writing MS Word files in Python
我知道有一些用于编辑Excel文件的库,但有没有任何用Python编辑MSWord 97/2000/2003的.doc文件的库呢?理想情况下,我希望根据文本的内容对文本的格式进行一些微小的更改。一个非常琐碎的例子是突出显示每个以大写字母开头的单词。
Possible Duplicate:
Reading/Writing MS Word files in Python
我知道有一些用于编辑Excel文件的库,但有没有任何用Python编辑MSWord 97/2000/2003的.doc文件的库呢?理想情况下,我希望根据文本的内容对文本的格式进行一些微小的更改。一个非常琐碎的例子是突出显示每个以大写字母开头的单词。
为什么不考虑使用python-uno来将文档加载到OpenOffice,并使用UNO接口进行操作呢?我刚刚链接的网站上有一些示例代码,可以帮助您入门。
如果平台独立性很重要,我建议使用OpenOffice API,可以通过BASIC或Python使用。OpenOffice也可以在无GUI的无头模式下运行,因此您可以将其自动化进行批处理作业。这些链接可能会有所帮助:
这绝对要比导入一个模块并进行字符串替换要复杂得多,但是OpenOffice可能是您可以连接到的最好的免费.doc阅读器。
PyWin32 库允许您从Python访问COM对象,包括各种Office COM API。我不会声称它易于使用,但它确实有效。
根据这篇 SO post,我了解到了jXLS,它使用了Apache POI。POI 有许多子组件,包括 HWPF:
HWPF is our port of the Microsoft Word 97 file format to pure Java. It supports read, and limited write capabilities. Please see the HWPF project page for more information. This component is in the early stages of development. It can already read and write simple files.
由于这是一个Java库,它可以使用Jython进行脚本编写。我现在不知道它的编写能力如何,但如果有帮助,请回复评论。