Python的DOCX现在的Python的OpenXML的一部分。还有各种新的东西,包括Python 3的支持,姐妹库做Excel文件,等等。看看当前的Python DOCX GitHub上和当前的Python的docx文档。
以下信息保持备案。去使用新的东西!
介绍
该DOCX模块创建,读取和写入的Microsoft Office Word 2007中的docx文件。
这些被称为“WordML中”,“的Office Open XML”和“开放XML”微软。
这些文件可以在Microsoft Office二千零一十分之二千零七,微软的Mac Office 2008中,谷歌文件,OpenOffice.org 3,和苹果的iWork 08打开。
他们还验证为良好的XML。
该模块时,我一直在寻找的MS Word中的.docx文件的Python支持创建,但只能找到涉及COM自动化的各种黑客攻击,调用.NET或Java,或自动OpenOffice或微软Office。
该DOCX模块具有以下特点:
制作文件
为使文件特点包括:
段
子弹
编号列表
文档属性(作者,公司等)
标题多级
表
科和分页符
图片
http://github.com/mikemaccana/python-docx/raw/master/screenshot.png
编辑文件
感谢lxml的模块,我们可以迷死:
搜索和替换
提取文件明文
添加并在文档中的任意位置删除项目
更改文档属性
针对运行在文档中特定位置的XPath查询 - 检索与用户完成的模板数据是有用的。
入门
制定和修改的文件
只要下载蟒蛇的docx。
使用PIP或easy_install的,以获取LXML和PIL模块。
然后运行:
example-makedocument.py
恭喜你,你只是做,然后修改Word文档!
从文档中提取文本
如果你只是想提取一个Word文件中的文本,运行:
example-extracttext.py“有些字file.docx'新file.txt的”
想法和待办事项列表
图像处理的进一步改善
文档健康检查
蛋
降价转换支持
我们爱叉,变更和拉的请求!
退房[HACKING](HACKING.markdown),以增加自己的变化!
对于这个项目在GitHub上
通过GitHub上发送pull请求,我们将添加更改!
以下信息保持备案。去使用新的东西!
介绍
该DOCX模块创建,读取和写入的Microsoft Office Word 2007中的docx文件。
这些被称为“WordML中”,“的Office Open XML”和“开放XML”微软。
这些文件可以在Microsoft Office二千零一十分之二千零七,微软的Mac Office 2008中,谷歌文件,OpenOffice.org 3,和苹果的iWork 08打开。
他们还验证为良好的XML。
该模块时,我一直在寻找的MS Word中的.docx文件的Python支持创建,但只能找到涉及COM自动化的各种黑客攻击,调用.NET或Java,或自动OpenOffice或微软Office。
该DOCX模块具有以下特点:
制作文件
为使文件特点包括:
段
子弹
编号列表
文档属性(作者,公司等)
标题多级
表
科和分页符
图片
http://github.com/mikemaccana/python-docx/raw/master/screenshot.png
编辑文件
感谢lxml的模块,我们可以迷死:
搜索和替换
提取文件明文
添加并在文档中的任意位置删除项目
更改文档属性
针对运行在文档中特定位置的XPath查询 - 检索与用户完成的模板数据是有用的。
入门
制定和修改的文件
只要下载蟒蛇的docx。
使用PIP或easy_install的,以获取LXML和PIL模块。
然后运行:
example-makedocument.py
恭喜你,你只是做,然后修改Word文档!
从文档中提取文本
如果你只是想提取一个Word文件中的文本,运行:
example-extracttext.py“有些字file.docx'新file.txt的”
想法和待办事项列表
图像处理的进一步改善
文档健康检查
蛋
降价转换支持
我们爱叉,变更和拉的请求!
退房[HACKING](HACKING.markdown),以增加自己的变化!
对于这个项目在GitHub上
通过GitHub上发送pull请求,我们将添加更改!