。
我想从扩展名为docx的word文档中提取数据。本文档包含一个表。我想从表的每一列和每一行中获取数据。
然后我想处理数据并将其插入到各自字段下的 Excel 文件中。
任何人都可以指导我如何在 python 中执行此操作。
我在 Windows 7 上使用 python3。(可能还想在 Windows 服务器 2003 上运行此代码)。
任何帮助将不胜感激。
谢谢
尝试类似操作:
import win32com.client as w32c
Word = w32c.Dispatch("Word.Application")
Word.Visible=1
doc=Word.Documents.Open("C:\docx_with_a_table.docx")
tables=doc.Tables
for t_cnt in range(tables.Count):
table=tables[t_cnt]
for r_cnt in range(table.Rows.Count):
row=table.Rows[r_cnt]
for c_cnt in range(row.Cells.Count):
cell=row.Cells[c_cnt]
print(cell.Range.Text)
Word 文档上的 ALT+F11 和 F2 将显示 VBA 对象...在Perl中,上述过程被更好地记录下来。
读取和写入Excel得到了Python3软件包xlrd3和xlwt3的良好支持