MS SharePoint Search API 不返回所有文件



我正在通过Rest使用MS SharePoint Search API来获取SharePoint网站上所有PDF文件的文件路径。我使用搜索API迭代,因为网站上有5000多个文件。

我正在做的是:

https://[root_url]/_api/search/query?QueryText='*+site:"[root_url]/[listname]"'
&RowLimit=500&RowsPerPage=500&StartRow=0&Refiners='fileType'
&RefinementFilters='fileType:pdf'&TrimDuplicates=false

直到列表为空。

列表名称包含空白。查询有效,它返回2661个文件。TrimDuplicates以某种方式完成了它的工作。如果没有TrimDuplicates,查询仅返回1169个文件。

有些丢失的文件是重复的。它们位于不同的地方,具有相同的名称和内容。但是有些文件根本不见了。

我可以通过以下途径下载丢失的文件:

https://[root_url]/_api/web/GetFolderByServerRelativeUrl('[path]')/Files('[filename]')/$value

有什么提示吗?

您可以使用搜索查询工具查询丢失的文档(例如,按标题或路径(,并将托管属性与查询中的过滤器进行比较。如果您根本无法通过搜索查询获取文件,请确保该列表未从搜索索引中排除,并且爬网为文档编制了索引。

相关内容

  • 没有找到相关文章

最新更新