ElasticSearch/Tire:如何正确设置部分单词搜索

尽管我看过很多关于它的描述，认为这是相对简单的，但我还没有设法看到它正常工作。比如这里是:

class Car < ActiveRecord::Base
  settings analysis: {
    filter: {
      ngram_filter: { type: "nGram", min_gram: 3, max_gram: 12 }
    },
    analyzer: {
      partial_analyzer: {
        type: "snowball",
        tokenizer: "standard",
        filter: ["standard", "lowercase", "ngram_filter"]
      }
    }
  } do
    mapping do
      indexes :name,                    index_analyzer: "partial_analyzer"
    end
  end
end

假设我有一辆名为"Ford"的汽车，我更新了索引。现在，如果我搜索"Ford":

Car.tire.search { query { string "Ford" } }

我的车在我的结果里。现在，如果我查找for:

Car.tire.search { query { string "For" } }

我的车不见了。我以为nGram过滤器会自动为我处理它，但显然它不是。作为临时解决方案，我使用通配符(*)进行此类搜索，但这绝对不是最好的方法，因为min_gram和max_gram定义是搜索中的关键元素。有人能告诉我他们是怎么解决的吗?

我使用Rails 3.2.12与ruby 1.9.3。ElasticSearch版本为0.20.5。

您想使用自定义分析器而不是雪球分析器:Elasticsearch自定义分析器

基本上其他分析器都带有一组预定义的过滤器和标记器。

你可能还想使用Edge-Ngram过滤器:Edge-Ngram过滤器

Edge-NGram和NGram之间的区别基本上是Edge-NGram基本上只坚持术语的"边"。从前面或后面开始。Ford -> [For]代替-> [For, ord]

关于自动完成主题的一些高级链接:

自动补全与模糊(纯弹性搜索，没有轮胎，但非常好的阅读)

另一个提供链接的有用问题

编辑

基本上我的设置和你的非常相似。但是对title和多字段都使用另一个分析器。由于多语言支持，这里是一个名称数组，而不仅仅是一个名称。

我还指定了search_analyzer，并且使用字符串键而不是符号。这是我实际得到的:

settings "analysis" => {
    "filter" => {
        "name_ngrams"  => {
            "side"     => "front",
            "max_gram" => 20,
            "min_gram" => 2,
            "type"     => "edgeNGram"
        }
    },
    "analyzer" => {
        "full_name"     => {
            "filter"    => %w(standard lowercase asciifolding),
            "type"      => "custom",
            "tokenizer" => "letter"
        },
        "partial_name"        => {
            "filter"    => %w(standard lowercase asciifolding name_ngrams),
            "type"      => "custom",
            "tokenizer" => "standard"
        }
    }
} do
  mapping do
    indexes :names do
      mapping do
        indexes :name, :type => 'multi_field',
                :fields => {
                    "partial"           => {
                        "search_analyzer" => "full_name",
                        "index_analyzer"  => "partial_name",
                        "type"            => "string"
                    },
                    "title"      => {
                        "type"     => "string",
                        "analyzer" => "full_name"
                    }
                }
      end
    end
  end
end

相关内容

最新更新

热门标签：