从 Python 中的 docx 文件中提取数据



我想从扩展名为docx的word文档中提取数据。本文档包含一个表。我想从表的每一列和每一行中获取数据。

然后我想处理数据并将其插入到各自字段下的 Excel 文件中。

任何人都可以指导我如何在 python 中执行此操作。

我在 Windows 7 上使用 python3。(可能还想在 Windows 服务器 2003 上运行此代码)。

任何帮助将不胜感激。

谢谢

尝试类似操作:

import win32com.client as w32c
Word = w32c.Dispatch("Word.Application")
Word.Visible=1
doc=Word.Documents.Open("C:\docx_with_a_table.docx")
tables=doc.Tables
for t_cnt in range(tables.Count):
    table=tables[t_cnt]
    for r_cnt in range(table.Rows.Count):
        row=table.Rows[r_cnt]
        for c_cnt in range(row.Cells.Count):
            cell=row.Cells[c_cnt]
            print(cell.Range.Text)

Word 文档上的 ALT+F11 和 F2 将显示 VBA 对象...在Perl中,上述过程被更好地记录下来。

读取和写入Excel得到了Python3软件包xlrd3和xlwt3的良好支持

相关内容

  • 没有找到相关文章

最新更新