我可以使用nltk使用维基百科的内容构建答案引擎吗?



我已经用php建立了一个使用维基百科内容的回答引擎。它只是返回与特定查询最相关的维基百科文章,在大多数情况下,这些文章都是无用的。用户往往会问这样的问题:"鲁尼的身高是多少?"我想给出鲁尼的确切身高,这可以在他的维基百科文章中找到。如果我用nltk可以解决这个问题吗?请建议。

一般来说:是的,这是可能的,但是构建这样一个程序是一项非常困难的任务。

你正在搜索的东西被称为"语义搜索引擎"(参见维基百科),有很多研究正在进行中,我们如何建立一个"语义网"以及如何提取网页信息,这样你提到的问题就可以由计算机来回答,而不仅仅是提供相关文档的链接。但结果还远远不够完美。

更好的语义搜索引擎之一似乎是真知,当然还有前面提到的wolframalpha(它在科学方面有它的优势)。

如果您真的想构建这样一个语义搜索引擎,NLTK可能会提供一些有用的基本工具,但不要指望这是一项简单的任务。

最新更新