有办法修复InDesign元素顺序吗



我们有一个InDesign文档,要从中提取数据
每个项目的格式如下:

Header
Address
Phone Number
Email
Info paragraph

不幸的是,制作该文档的人没有考虑导出这些信息,基本上将InDesign视为文字处理器。他们没有为元素使用标签,也没有按照元素的出现顺序添加元素。由于InDesign将添加的顺序元素视为实际顺序,因此试图将内容拉出(通过复制页面、导出到Word、导出到文本,几乎是我尝试过的所有操作(,会导致如下混乱的输出:

Header1
Info Paragraph1
Header2
Address2
Info Paragraph2
Phone2
EMail2
Email1
Phone1

是否有某种方法可以重构InDesign文件,以便将更高级别的项目向后推,以便它们首先导出?

如果我能按正确的顺序得到这些,那么我就可以编写一个解析器来正确地导出其中的大部分。

我需要按Y轴(从上到下(的顺序,对于具有相同Y坐标的元素,从左到右。我曾尝试让文档团队导出到XML。我还试着在各种文字处理应用程序中打开它,并将其保存为文本或HTML格式,结果它们都以自上而下的顺序结束。

然而,我想我找到了答案。我又试了一次Word,这次似乎奏效了。我的确切过程是在Edge中打开PDF,然后保存并在Word中打开PDF。我这样做是为了提醒自己,混乱的元素在里面看起来是什么样子,但令我惊讶的是,这次它的顺序是正确的
此解决方案可能仅适用于Word 365。

最新更新