我仍然很新来检索和排名以及文档转换服务,所以我最近一直在玩。
我遇到了一个问题,当我上传大型文档(100多页)时 - 检索和排名将帮助我自动将其分解为答案单元,这很棒且有用。
但是,有些问题只需要一小块的答案单元中,有没有办法可以手动分解回答和等级服务为我提供的答案单元?
我听说您可以通过JavaScript进行操作,但是有没有办法通过UI进行操作?
我正在考虑手动将巨大的文档分解为多个较小的文档,但这可能会导致100秒 - 这可能是我求助的最后一个选择。
任何帮助或建议都非常感谢!
谢谢大家!
首先,一个澄清:
检索和排名不会将您的文档分解为答案单位。当您的转换目标为 ANSWER_UNITS
时,文档转换服务就是这样做的。
关于您的问题:
我不完全理解您要做的事情,但是如果默认产生的答案单元不符合您的要求,则可以自定义转换过程的不同步骤以调整生成的答案单元。在这里查看文档。
具体来说,您要确保标题级别(对于Word,PDF或HTML,取决于您的文档类型),以一种方式定义他们检测每个答案单元的开始。然后,确保您定义的标题级别(H1,H2,H3等)包含在answer_units
部分中的selector_tags
列表中。
一旦您的自定义文档转换服务配置产生您要寻找的答案单元,您就可以将它们发送到检索和排名以索引。