首页{ "index.max_ngram_diff": 10, "analysis": { "analyzer": { "my_ngram_analyzer": { "tokenizer": "my_ngram_tokenizer" } }, "tokenizer": { "my_ngram_tokenizer": { "type": "ngram", "min_gram": 1, "max_gram": 10, "token_chars": [ "letter", "digit" ] } } } }

{ "index.max_ngram_diff": 10, "analysis": { "analyzer": { "my_ngram_analyzer": { "tokenizer": "my_ngram_tokenizer" } }, "tokenizer": { "my_ngram_tokenizer": { "type": "ngram", "min_gram": 1, "max_gram": 10, "token_chars": [ "letter", "digit" ] } } } }

时间: 2023-08-18 21:10:56 浏览: 174

maxdiff:maxdiff 的分析

最大差异这个简单的 Python 脚本使用来自 MaxDiff 估计的实用分数，并计算每个项目的相对分数。它允许在数据中使用过滤器和权重。当前输入为 .csv，它输出包含分数的 Pandas DataFrame。

您提供的是Elasticsearch的索引设置和分析器配置示例。该配置使用了ngram分词器创建了一个名为"my_ngram_analyzer"的自定义分析器，并使用了"my_ngram_tokenizer"作为其分词器。这个分词器将文本按照ngram的方式进行切分，生成包含不同长度的ngram片段。在这个配置中，min_gram参数设置为1，表示最小的ngram片段长度为1个字符；max_gram参数设置为10，表示最大的ngram片段长度为10个字符。此外，token_chars参数指定了被切分的字符类型，其中"letter"表示字母字符，"digit"表示数字字符。这个配置可以用于创建一个支持按照ngram方式进行文本搜索和匹配的索引。您可以将此配置应用到您的索引中，以便进行阿拉伯数字的查询或其他需要ngram方式进行文本匹配的场景。

阅读全文