Word文档包含包装在三个对象级别中的格式化文本。最低级别-运行对象,中间级别-段落对象和最高级别-文档对象。
因此,我们无法使用常规文本编辑器来处理这些文档。但是我们可以使用python-docx模块在python中操作这些word文档。
第一步是安装此第三方模块python-docx。您可以使用pip“ pip install python-docx”
安装后,导入“ docx”而不是“ python-docx”。
使用“ docx.Document”类开始使用word文档。
# import docx NOT python-docx import docx # create an instance of a word document doc = docx.Document() # add a heading of level 0 (largest heading) doc.add_heading('Heading for the document', 0) # add a paragraph and store # the object in a variable doc_para = doc.add_paragraph('Your paragraph goes here, ') # add a run i.e, style like # bold, italic, underline, etc. doc_para.add_run('hey there, bold here').bold = True doc_para.add_run(', and ') doc_para.add_run('these words are italic').italic = True # add a page break to start a new page doc.add_page_break() # add a heading of level 2 doc.add_heading('Heading level 2', 2) # pictures can also be added to our word document # width is optional doc.add_picture('path_to_picture') # now save the document to a location doc.save('path_to_document')