Python-使用.docx模块

Word文档包含包装在三个对象级别中的格式化文本。最低级别-运行对象,中间级别-段落对象和最高级别-文档对象。

因此,我们无法使用常规文本编辑器来处理这些文档。但是我们可以使用python-docx模块在python中操作这些word文档。

  • 第一步是安装此第三方模块python-docx。您可以使用pip“ pip install python-docx”

  • 安装后,导入“ docx”而不是“ python-docx”。

  • 使用“ docx.Document”类开始使用word文档。

示例

# import docx NOT python-docx
import docx
# create an instance of a word document
doc = docx.Document()
# add a heading of level 0 (largest heading)
doc.add_heading('Heading for the document', 0)
# add a paragraph and store
# the object in a variable
doc_para = doc.add_paragraph('Your paragraph goes here, ')
# add a run i.e, style like
# bold, italic, underline, etc.
doc_para.add_run('hey there, bold here').bold = True
doc_para.add_run(', and ')
doc_para.add_run('these words are italic').italic = True
# add a page break to start a new page
doc.add_page_break()
# add a heading of level 2
doc.add_heading('Heading level 2', 2)
# pictures can also be added to our word document
# width is optional
doc.add_picture('path_to_picture')
# now save the document to a location
doc.save('path_to_document')