ElasticSearch如何设置某个字段被检索时忽略全角半角格式

部分数据在获取时有全角半角的问题，尤其是英文字母，底层所有数据的清洗工作量太大，且涉及数据种类多，字段多。
所以想从检索方面下手，标点在检索时是可以直接忽略的，不知道有没有忽略全角半角的功能。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Leodong. 2023-03-13 11:35
关注
ElasticSearch提供了一个字符过滤器(Character Filter)叫做"normalize_charmap"，它可以在检索时将指定字符映射成其他字符，从而实现忽略全角半角格式的功能。

具体步骤如下：

1.在创建索引时，在分析器中指定字符过滤器(normalize_charmap)。
例如：

PUT /my_index { "settings": { "analysis": { "analyzer": { "my_analyzer": { "type": "custom", "tokenizer": "standard", "char_filter": [ "my_char_filter" ] } }, "char_filter": { "my_char_filter": { "type": "mapping", "mappings": [ "Ａ=>A", "Ｂ=>B", "０=>0", "１=>1", ... ] } } } }, "mappings": { "properties": { "my_field": { "type": "text", "analyzer": "my_analyzer" } } } }

2.搜索时，使用相同的分析器进行分词和字符过滤。
例如：

GET /my_index/_search { "query": { "match": { "my_field": { "query": "ａｂｃ１２３", "analyzer": "my_analyzer" } } } }

在上面的例子中，将全角的大写字母和数字映射成对应的半角字符，从而在搜索时忽略全角半角格式的差异。

需要注意的是，使用字符过滤器会增加索引和搜索的开销，因此需要根据实际情况进行权衡。

以上回答如果对您有用，望采纳～谢谢
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

elasticsearch 分词器变换全角和半角以及数字串模糊匹配
2021-12-07 14:30

会发paper的学渣的博客分词器变换全角和半角以及数字串模糊匹配
（大数据工程师学习路径）第一步 Linux 基础入门----正则表达式基础
2015-08-09 19:03

weixin_30348519的博客由于markdown表格解析的问题，下面的竖直分隔符用全角字符代替，实际使用时请换回半角字符 ) PCRE（Perl Compatible Regular Expressions中文含义：perl语言兼容正则表达式）是一个用 C 语言编写的正则表达式...
从Lucene到Elasticsearch：Lucene6.0与Elasticsearch5.4全文检索实战
2025-10-13 09:01

Shen Planck的博客全文检索技术通过构建倒排索引（Inverted Index），实现从“词项→文档”的快速映射，显著提升关键词定位效率。其核心思想是将文本切分为词条，并记录每个词条在哪些文档中出现及位置信息，从而支持模糊匹配、相关性...
工作中使用到的单词（软件开发）_2023_0316备份
2023-03-16 10:55

sun0322的博客 29.RMI的利用版本限制 36.Java不信任RMI的URL再次出错、解决、客户端（被攻击者）打开计算机成功 JNDI注入，再现具体操作 42.CVE-2021-44228 Impact of Log4j Vulnerability CVE-2021-44228 ■2022/12/23以降整理 03...
工作中使用到的单词（软件开发）
2020-03-15 01:02

sun0322的博客　alias 别名 powershell使用 get-help 命令时，会得到与此命令相关（别名）的命令２．プロキシ　proxy　代　理３．プロモート　promote 促进，提升　开发的系统新功能上线发布，有时会使用到这个词，比如 ...
PHP面试题(一)
2018-03-24 11:56

钟长森的博客变量默认总是传值赋值，那也就是说，当将一个表达式的值赋予一个变量时，整个表达式的值被赋值到目标变量，这意味着：当一个变量的赋予另外一个变量时，改变其中一个变量的值，将不会影响到另外一个变量 php也提供...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月13日

ElasticSearch如何设置某个字段被检索时忽略全角半角格式

1条回答 默认 最新

问题事件

1条回答默认最新