自动获取术语列表,导入Windows搜索功能(用于内容)以及结果的导出列表.(自动?)



我的下一个大挑战是编写一个脚本(我认为它将在自动化中,我几乎没有经验的领域)来自动化Windows搜索功能。

最终目标是从.txt文件(每行一个字符串)中获取搜索术语列表,并在计算机上搜索每个文档的内容以获取所述搜索词(一次)。

我可以手工实现这一目标 - 按内容函数打开搜索,索引所有附件驱动器上的所有文件,一一搜索术语,然后突出显示所有文件并另存为[搜索term] .txt。

但是,我需要自动化整个过程。我了解我可能需要为每个版本的Windows编写一个单独的脚本,它将与(XP,Vista,7,8)一起使用。

这是一项足够容易完成的任务,还是需要大量编程时间?谁能向我指向正确的方向?所有的帮助都非常感谢。

好吧,假设您的查询文本文件足够大,并且您实际上不想为每个文件迭代整个文件系统,那么您正在描述经典信息检索问题。

  1. 索引文件系统中的数据(这是一次仅完成一次的预处理)
  2. 对于每个查询 - 在索引中搜索它,并获取相关文档。

信息检索领域是一个巨大的研究领域,我真的不鼓励您尝试从头开始实施它。

我确实鼓励使用已经为您开发和测试的内置库。例如,在Java中,一个受欢迎的选择是Lucene-它非常广泛用于搜索到处搜索。

如果您不熟悉Java,我也知道该库的Python(Python)和.NET(Lucene.net)绑定。


要了解有关信息检索的更多信息,我推荐曼宁的信息检索简介

相关内容

  • 没有找到相关文章

最新更新