从 R 中的 Word 文档中提取源属性(元数据)



我有数百个 Word 文档 (.docx) 发送给我进行分析,我正在努力找到提取 Origin 元数据的方法。我想知道作者的姓名,创建的内容以及每个文档的最后保存日期 - 请注意,当您使用鼠标右键单击word文档并选择"属性"时,您可以在"详细信息"分隔符下检查这些属性。我想有一个数据帧,一个列表或类似的东西:[1] "document.name"authors.name"内容已创建" "上次保存日期"[2] "document.name2" "authors.name2" "content.created2" "date.lastsaved2"

没有人有解决这个问题的好方法?

谢谢!

也许是这样的:

setwd("/Desktop/docs") # set directory to wherever your docx files are
file.info(list.files(getwd())) # obtain file info for docs in folder

最新更新