IK 分词，当英文与数字混合搜索时，遇到 Elasticsearch 分词问题。

一、遇到问题的现象描述
1.1 英文和特殊字符连在一起的的分词，比如 Special Feature Note for T972-SE.pdf
1.2 使用 ik_smart 会直接分词为 t972-se.pdf
1.3 使用 ik_max_word 会分词为：

二、希望达到的效果
2.1 要求分词为 t972 和 se，且不分词成单独 t
2.2 使用的 ik 的自定义字典，将 - 作为单词，只对 ik_max_word 起作用，对 ik_smart 无效
2.3 要求不能搜 t 搜出来结果

三、我尝试的解决办法
3.1 我还使用了字符过滤器 char_filter
3.2 处理了特殊字符，使用的自定义分词器为 my_analyzer，也有分出单个字符
3.3 T972-SE.pdf 把这个当做分隔符，横杠，也试过。
3.4 标准分词器不能对中文分词，也不支持大小写，所以只能用IK。

四、操作环境、软件版本
4.1 IK 与 ES，都是6.4.3
4.2 操作系统使用 Linux

五、麻烦看看，如何收费
5.1 我认可知识付费。
5.2 可以根据标准，提供收费方式。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

这是谁的博客？优质创作者: 后端开发技术领域 2021-09-07 19:22

关注

PUT /test_analyzer
{
  "settings": {
    "analysis": {
      "analyzer": {
        "test_analyzer": {
          "tokenizer": "ik_max_word",
          "char_filter": "patten_char_filter",
          "filter": "stop_filter"
        }
      },
      "char_filter": {
          "patten_char_filter": {
          "type" : "pattern_replace",
          "pattern" : "-",
          "replacement" : " "
        }
      },
      "filter": {
        "stop_filter": {
          "type"      : "stop",
          "stopwords" : ["t"]
        }
      }
    }
  }
}
 
 
GET /test_analyzer/_analyze
{
  "analyzer": "test_analyzer", 
  "text": "Special Feature Note for T972-SE.pdf"
}

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

elasticsearch-analysis-ik-8.9.0 ik分词器
2024-10-11 18:20

Elasticsearch的IK分词器插件是处理中文内容的重要工具，它与Elasticsearch的其他组件一道，提供了一个强大、灵活、可扩展的全文搜索引擎解决方案。通过使用这些高级功能，用户可以构建出既高效又准确的搜索系统，以...
ES IK分词器插件elasticsearch-analysis-ik-7.8.0
2024-12-30 10:12

ES IK分词器插件是专门为Elasticsearch搜索引擎设计的中文分词处理工具，版本为7.8.0。该插件能够有效地处理中文内容，将其分词，以便于Elasticsearch更好地进行搜索和分析操作。该插件采用智能分词技术，能够对中文...
基于Elasticsearch的IK中文分词器.zip
2024-09-06 21:46

该插件基于Lucene IK分词器，提供了细粒度和智能分词两种模式，适用于中文文本的搜索和分析。项目的主要特性和功能 1. 多种分词模式 iksmart智能分词模式，适用于粗粒度分词。 ikmaxword最大词库模式，适用于...
elasticsearch-7.17.10-x86-64已安装插件 ik分词器、head、ingest-attachment
2024-02-04 18:05

Elasticsearch是一个强大的开源搜索引擎和分析引擎，广泛应用于大数据处理、日志分析、实时搜索等领域。7.17.10是其一个重要的版本，针对x86_64架构进行了优化，确保在64位系统上的高效运行。在这个版本中，已经预装...
Elasticsearch安装IK中文分词器
2024-11-04 14:38

重启完成后，IK分词器将自动集成到Elasticsearch中，用户可以在创建索引时通过指定分词器来使用IK分词器。例如，在创建索引的时候，可以指定使用ik_max_word或ik_smart分词器来对索引进行文本分析。除了基本的安装...
elasticsearch ik 7.4.2 分词器
2022-05-07 13:16

以上配置后，当索引包含中文内容时，Elasticsearch会使用IK分词器进行分词，提高搜索和分析的准确度。总的来说，Elasticsearch结合IK分词器，能有效解决中文处理的问题，提供强大的全文检索功能。在实际应用中，...
es ik分词器资源下载包
2025-08-19 10:53

Elasticsearch作为一个高性能的实时分布式搜索和分析引擎，其默认的英文分词器对于中文内容的处理效果并不理想，因此es ik分词器应运而生。ik分词器能够很好地对中文文档进行分词处理，使其更适合中文用户使用。该...
IK分词器8.15.0 elasticsearch-analysis-ik-8.15.0.zip
2024-09-05 16:30

8.15.0版本的IK分词器主要用于Elasticsearch 8.15.0版本，提供了一系列的中文分词功能，以满足用户在搜索和文本分析时对中文分词的需求。首先，IK分词器的核心功能是通过不同的分词算法来对中文文本进行处理。常见...
elasticsearch7.8.0版本的IK分词器
2020-12-30 15:06

9. **插件安装与升级**: 安装 IK 分词器非常简单，只需将 `elasticsearch-analysis-ik-7.8.0` 文件解压后放入 Elasticsearch 的 plugins 目录下，重启服务即可。如果需要升级，只需替换新的插件版本并重新启动。在...
【搜索引擎技术】基于Docker的Elasticsearch单节点与集群部署方案：含Kibana可视化及IK中文分词器集成应用
2026-01-08 14:24

②为Elasticsearch集成IK分词器以支持中文搜索；③通过扩展词典和停用词典实现业务定制化分词；④利用docker-compose搭建多节点ES集群以模拟生产环境。; 阅读建议：建议在具备Linux和Docker操作经验的前提下，结合...
ik分词器7.17.10
2023-06-19 16:37

ik分词器是为Elasticsearch（ES）设计的一款高效、可扩展的中文分词工具，它能有效地将中文文本拆分成一个个独立的词语，便于后续的索引和查询操作。ik分词器7.17.10是该工具的一个版本，适用于Elasticsearch 7.x...
IK分词器elasticsearch-analysis-ik-7.17.16
2023-12-24 13:31

IK分词器是针对Elasticsearch设计的一款强大的中文分词插件，其全称为"elasticsearch-analysis-ik"。在Elasticsearch中，分词器的作用至关重要，它负责将用户输入的文本进行词汇切分，以便进行后续的搜索和分析操作...
ik分词器tar包 7.10.2
2022-03-03 12:15

6. **与Elasticsearch集成**：IK分词器与Elasticsearch有良好的集成，安装简单，只需将解压后的`elasticsearch-analysis-ik-7.10.2`目录复制到Elasticsearch的`plugins`目录下即可。 **安装与使用** 1. **下载与...
elasticsearch-analysis-ik-7.4.0 ik分词器7.4.0
2022-04-05 09:11

版本 7.4.0 是该插件针对 Elasticsearch 7.4.0 版本的一个优化版本，确保与 Elasticsearch 的兼容性和性能。 **IK 分词器介绍** IK 分词器由“智能中文分词系统”发展而来，支持多种分词模式，包括精确模式、全...
elasticsearch ik-8 分词器
2025-07-31 13:28

Elasticsearch是一个基于Lucene构建的开源、分布式搜索和分析引擎，能够处理大规模数据并具备实时的搜索功能。它被广泛应用于全文搜索、结构化搜索和分析等多种场景。Elasticsearch中的分词器扮演着将文本数据分解为...
7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器
2023-08-07 19:34

elasticsearch-analysis-ik 是一个常用的中文分词器，在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点：中文分词：elasticsearch-analysis-ik 是基于...
elasticsearch-ik中文分词器7.6.2.zip
2020-04-11 15:01

在Elasticsearch中使用IK分词器，首先需要将"elasticsearch-analysis-ik-7.6.2.jar"文件放到Elasticsearch的plugins目录下。然后，通过Elasticsearch的命令行工具或配置文件启用插件。配置通常涉及以下步骤： 1. ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金 9月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月6日
展开全部

IK 分词，当英文与数字 混合搜索时，遇到 Elasticsearch 分词问题 。

4条回答 默认 最新

问题事件

IK 分词，当英文与数字混合搜索时，遇到 Elasticsearch 分词问题。

4条回答默认最新