一种通过搜索一组给定的文档来找到问题答案的方法



正如标题所示,我需要找到/创建一个能够通过搜索一组给定文档来检索查询相关信息的系统。从我自己的研究来看,我只发现了执行基于索引的搜索的库,它们可以指出哪些文档与查询匹配,但不能提取相关信息。简而言之,用户将提出一个问题,系统将通过搜索给定的一组文档来尝试找到该问题的答案。

谁能给我指出一个实现这个的方法,或者一个可能帮助我的库?

为您的用例提供定制建议,这些信息将会很有帮助:

  • 文件类型:主题、写作风格;
  • 编程语言或操作系统的优先级?
  • 结果应该只是显示一些上下文围绕找到的文本段落或短语一个正确的答案句子?

一般来说,这项任务似乎需要对文本进行标记和语义解析。我最喜欢nltk http://www.nltk.org/

最新更新