{ "index.max_ngram_diff": 10, "analysis": { "analyzer": { "my_ngram_analyzer": { "tokenizer": "my_ngram_tokenizer" } }, "tokenizer": { "my_ngram_tokenizer": { "type": "ngram", "min_gram": 1, "max_gram": 10, "token_chars": [ "letter", "digit" ] } } } }
时间: 2023-08-18 21:10:56 浏览: 174
maxdiff:maxdiff 的分析
您提供的是Elasticsearch的索引设置和分析器配置示例。该配置使用了ngram分词器创建了一个名为"my_ngram_analyzer"的自定义分析器,并使用了"my_ngram_tokenizer"作为其分词器。
这个分词器将文本按照ngram的方式进行切分,生成包含不同长度的ngram片段。在这个配置中,min_gram参数设置为1,表示最小的ngram片段长度为1个字符;max_gram参数设置为10,表示最大的ngram片段长度为10个字符。
此外,token_chars参数指定了被切分的字符类型,其中"letter"表示字母字符,"digit"表示数字字符。
这个配置可以用于创建一个支持按照ngram方式进行文本搜索和匹配的索引。您可以将此配置应用到您的索引中,以便进行阿拉伯数字的查询或其他需要ngram方式进行文本匹配的场景。
阅读全文