拆分文档文件页面并使用 gembox 文档转换为 PDF



我想通过搜索每个页面上的特定单词(可能在一页或多页上(将该页面的全部内容转换为PDF。 例如,我们有一个有三页的文件,第一页上有一个特殊单词,第三页上有下一个特殊单词。我想将 PDF 从第一页保存到第二页,然后分别保存第三页。PDF 文件将根据该页面上的特定单词命名。

我的问题是我不知道如何循环每个页面并阅读该页面的内容以找到特殊单词并将页面另存为 PDF。 谢谢

这是你可以做到的。

  1. 使用DocumentModel.GetPaginator方法对 Word 文档进行分页。
  2. 使用扩展方法读取每个页面FrameworkElement.ToText文本内容。
  3. 使用DocumentModelPage.Save方法将所选页面保存为 PDF。

换句话说,请尝试以下操作:

string search = "Your Specific Word";
string inputPath = "input.docx";
// Load Word document.
var document = DocumentModel.Load(inputPath);
// 1. Get document's pages.
var pages = document.GetPaginator().Pages;
for (int i = 0, count = pages.Count; i < count; ++i)
{
// 2. Read page's text content.
DocumentModelPage page = pages[i];
string pageTextContent = page.PageContent.ToText();
// 3. Save page as PDF.
if (pageTextContent.Contains(search))
{
string outputPath = $"{search}_{i}.pdf";
page.Save(outputPath);
}
}

最新更新