"normalizer": "my_normalizer"
时间: 2023-08-25 10:07:16 浏览: 38
好的,你的第一个问题是关于一个叫做 "normalizer" 的东西,它的值被设置为 "my_normalizer"。你想知道这代表什么意思。
"normalizer" 是一个用于处理文本的函数或类。在这个特定的情况中, "my_normalizer" 是一个自定义的文本处理器,可能由你自己编写或从其他地方获取。这个 "normalizer" 会被用来规范化输入的文本,使得输入的文本符合 ChatGPT 模型的预期格式。
相关问题
"analysis": { "analyzer": { "my_analyzer": { "type": "custom", "tokenizer": "ik_max_word", "filter": [ "lowercase" ], "char_filter": [] } }, "normalizer": { "my_normalizer": { "type": "custom", "filter": [ "lowercase", "asciifolding" ] } } } },
这段代码看起来是一个 Elasticsearch 的索引配置文件,其中定义了一个名为 "my_analyzer" 的自定义分析器,使用了 "ik_max_word" 分词器和 "lowercase" 过滤器。此外还定义了一个名为 "my_normalizer" 的自定义规范化器,使用了 "lowercase" 和 "asciifolding" 过滤器。这些分析器和规范化器可用于搜索引擎在对文本进行索引和搜索时进行分词和规范化处理。
elasticsearch 使用 normalizer 过滤掉 html标签 请举例
当然可以,比如使用以下的自定 normalizer,它可以过滤掉字符串中的HTML标签:
```
PUT /test
{
"settings": {
"analysis": {
"normalizer": {
"my_normalizer": {
"type": "custom",
"char_filter": [],
"filter": [ "lowercase", "asciifolding", "html_strip" ]
}
}
}
},
"mappings": {
"properties": {
"title": {
"type": "keyword",
"normalizer": "my_normalizer"
}
}
}
}
```
相关推荐
![m](https://img-home.csdnimg.cn/images/20210720083646.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)