通过python代码在docx文件中查找红色单词



我有一个mircosoft docx文件,其中有几个红色单词。现在我想通过python代码读取该文件,并提取那些红色单词。

但我找不到应该用于它的api。我试图在para上迭代以访问单个单词。。但它说para是不可迭代的。我也不知道如何检查单词的颜色。

你能帮忙吗?

import docx
def readtxt(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
print(para.text);
readtxt('C:\Users\X\some.docx')

问候

尝试此操作,函数将返回文档中位于red中的所有连续部分的列表。

import docx
from docx.shared import RGBColor
def readtxt(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
for run in para.runs:
if run.font.color.rgb == RGBColor(255, 000, 000):
fullText.append(run.text)
return fullText
fullText = readtxt('filepath.docx')

此外,请检查您是否正确通过了filepath

相关内容

最新更新