elasticsearch使用IK分词搜索 5C

我使用IK分词器,把搞笑分词为一个词语,只搜搞这个字怎么才能搜出来,大家有遇到这个问题的吗?

0

3个回答

0
0

要想即能搜出搞笑又能搜出单个字,要结合ik分词和stander分词同时使用来达到这个目的了。
比如在索引里面,增加一个字段,或者在建立mapping的时候采用copy的方式来增加一个字段来存储同样的值。
一个字段使用ik分词来索引,要给使用stander来索引,搜索的时候使用multi_match来检索这两个字段

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
elasticsearch 利用ik分词搜索
1.不使用ik分词的情况 map "article": { "properties": { "author": { "store": true, "type": "string" }, "id": {
ElasticSearch搜索服务器与IK分词器
ElasticSearch搜索服务器1.java语言全文检索技术2.ElasticSearch 安装配置使用入门 Window系统下载zip版本,linux系统下载tar版本 下载解压之后 bin 存放elasticSearch 运行命令 config 存放配置文件 data 存放数据 lib 存放elsticSearch运行依赖jar包 logs 存放日志 modul
elastic search配置ik分词及pinyin分词使搜索同时支持中文和拼音搜索
有这样一个需求:对于某个中文field进行ik分词,并对ik分词后的结果进行pinyin分词,这样我通过中文和英文都可以对此field进行搜索。 比如说“道路挖掘”,分词结果是道路 和 挖掘,其拼音应该是daolu和wajue,那么我通过daolu或道路应该都能搜索到这条记录。 如何解决呢?1. 先下载ik分词和pinyin分词,并放到esplugins相应目录中通过kibanaGET /_cat...
Elasticsearch5.3.1 IK分词,同义词/联想搜索设置
本文主要是记录Elasticsearch5.3.1 IK分词,同义词/联想搜索设置,本来是要写fscrawler的多种格式(html,pdf,word...)数据导入的,但是IK分词和同义词配置还是折腾了两天,没有很详细的内容,这里决定还是记录下来。IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了
ElasticSerach之分词器进阶-短语搜索不准确bug及修复实现
在ElasticSearch中,针对全文检索,我们都会采用分词的方式进行搜索,常用的分词器比如ansj,ik等,在使用了这些分词器后,中文搜索效果得到较好的改善,但是,也在一些不显眼的方面暴露出分词器与lucene不够兼容的问题,最终导致搜索结果不准确,比较典型的如短语搜索.      为了更清晰的描述问题,我们做个如下实验: 1.随机抽取包含“新能源” 且 “的数据 M 条 2.设置样本中
Elasticsearch搜索引擎第三篇-ES集成IKAnalyzer中文分词器
文章目录获取ES-IKAnalyzer插件安装插件扩展词库Kibana测试创建一个索引创建一个映射mapping提交一些索引数据搜索 在Lucene和Solr中讲到,集成中文分词器是相对比较麻烦的,需要我们自定义类并打成对应的jar包,在Elasticsearch中,我们不需要这么麻烦,因为已经有现成的插件可以使用。 获取ES-IKAnalyzer插件 下载地址:https://github.co...
elasticsearch ik分词实现 中文、拼音、同义词搜索
EasticSearch版本:1.5.2 1、配置分词器:配置IK,参照 《ElasticSearch 安装和使用IK分词器》 2、拼音分词器配置:使用已经编译好的:elasticsearch-analysis-pinyin-1.3.0   2.1、在elasticsearch的plugins目录下,新建analysis-pinyin文件夹,解压上述压缩包,将里面的    放到ana
elasticsearch5.1+IK分词器+Java实现近义词功能
说明 es版本:5.1.1 ik版本:5.1.2 开发:Java,TransportClient http://blog.csdn.net/tianzhaixing2013/article/details/51506496 这篇文章是es2.x版本+IK的近义词配置教程,es5.1的话一些地方还不一样。我从这篇文章中学到了不少,在此谢谢作者。 然后自己在此基础上改了改试了试,终于实现了近义词的功
Elasticsearch 系列指南(三)——集成ik分词器
Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(例如“the”这个词)等;chinese 效果很差。这次主要玩这
分布式搜索引擎ElasticSearch、IK分词器、elasticsearch与MySQL数据同步
1.什么是ElasticSearch Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。...
Spring Boot + Elasticsearch实现大批量数据集下中文的精确匹配-案例剖析
缘由 数据存储在MYSQ库中,数据基本维持不变,但数据量又较大(几千万)放在MYSQL中查询效率上较慢,寻求一种简单有效的方式提高查询效率,MYSQL并不擅长大规模数据量下的数据查询。 技术方案 考虑后期同样会使用到es,此次直接结合spring-boot框架形成一个独立服务,并不涉及UI展现内容,(ES版本2.4.5,5.0+版本的话就不能再使用spring data elas
Elasticsearch之插件es ik配置自定义中文分词词典
1. 首先需要安装好ik 可以参考本人blog http://blog.csdn.net/qq_30581017/article/details/79533240 或者github地址下载对应版本的ik: https://github.com/medcl/elasticsearch-analysis-ik 2. 配置自定义中文分词词典 如果宝宝们已经安装好ik,在es中测试分词成功...
Elasticsearch5.x安装IK分词器以及使用
Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(例如“the”这个词)等;chinese 效果很差; 1、el...
ElasticSearch 6.x 学习笔记:4.IK分词器插件
4.1 elasticsearch-analysis-ik 6.1.1 (1)源码 https://github.com/medcl/elasticsearch-analysis-ik (2)releases https://github.com/medcl/elasticsearch-analysis-ik/releases (3)复制zip地址 https://github...
elasticsearch全局检索多分词器匹配
在es全局检索的需求中,需要进行多个分词器同时匹配关键词,例如: 在商品名称、品牌名称和类目名称中匹配含有“西”关键字的查询结果,当一个字段匹配时即加入查询结果 用sql语句表达为:select  *  from  item where item_name like '%西%' or brand_name like '%西%' or c_name like '%西%' 其中item_name
ElasticSearch:为中文分词器增加对英文的支持(让中文分词器可以处理中英文混合文档)(转)
本文地址,需转载请注明出处: http://blog.csdn.net/hereiskxm/article/details/47441911 当我们使用中文分词器的时候,其实也希望它能够支持对于英文的分词。试想,任何一个存储文字的字段都有可能是中英文夹杂的。 我们的项目中使用IKAnalyzer作为中文分词器,它在处理文档过程中遇到英文时,利用空格和标点将英文单词取出来,同时也会对其转全小写处理。...
elasticsearch 安装ik分词器及自定义分词库的
一.es 安装ik分词器(6.0.0)      1.场景描述:Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(...
elasticsearch 修改IK分词器源码 mysql热词动态更新踩坑记
最近公司业务需求用到了elasticsearch 。由于是内部使用,好多检索词语不确定,需要自定义好多热词,为了方便添加热词而又不必频繁重启es所以想动态更新以满足需求。 版本: elasticsearch 6.5.2 mysql 5.6 jdk1.8 话不多说,IK源码添加mysql修改参考https://blog.csdn.net/wuzhiwei549/article/detail...
全文搜索引擎 Elasticsearch 入门(ik,kibana,x-pack)
全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。 它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它...
Spring中使用ElasticSearch实现中文分词全文搜索
1,创建Index: 需要使用全文索引的字段,需要添加analyzer属性 PUT /industry_index { "settings": { "refresh_interval": "5s", "number_of_shards" : 3, "number_of_replicas" : 2, "analysis" : {
java中调用ElasticSearch中文分词ik没有起作用
问题描述: 项目中已经将’齐鲁壹点’加入到扩展词中,但是使用客户端调用的时候,高亮显示还是按照单个文字分词的; 解决方案: 1.创建Mapping使用的分词使用ik 2.查询使用QueryBuilders.termQuery(“title”, key) 查询结果高亮显示:
Elasticsearch6.2.3及其head插件安装 中文分词 elasticsearch-analysis-ik 拼音分词 同义词分词
1.下载并解压elasticsearch 官网 http://www.elastic.co/downloads/elasticsearch 本次下载地址 https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.3.tar.gz  解压  tar -zxvf  elasticsearch-6.2.3.tar....
ElasticSearch测试、IK分词简单测试(PHP)
以下全是测试代码:如有需要了解安装 ElasticSearch和IK分词的可参考:https://blog.csdn.net/weixin_42579642/article/details/84317099 use Elasticsearch\ClientBuilder; class ElasticController extends Controller { public funct...
Elasticsearch之中文分词器插件es-ik的自定义词库
前提,Elasticsearch之中文分词器插件es-ik     针对一些特殊的词语在分词的时候也需要能够识别  有人会问,那么,例如:          如果我想根据自己的本家姓氏来查询,如zhouls,姓氏“周”。              如果我想根据自己的公司名称来查询,如“好记性不如烂笔头感叹号博客园”           如果我想根据自己公司里的产品名称来查询,如“”        ...
Elasticsearch 学习之 Ik分词添加停用词
添加的词典需为utf-8编码
elasticsearch安装中文分词(ik)与添加自定义词库
es的分词对中文不友好,要中文分词器插件, 安装ik服务 (记得改好版本号) ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v5.6.5/elasticsearch-analysis-ik-5.6.5.zip 安装及文件,请参考
elasticsearch 5.6.7在线安装ik分词,亲测有效
官网的在线安装命令  ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.3.0/elasticsearch-analysis-ik-6.3.0.zip 因为我自己安装的es是5.6.7,版本不一致会报错的 所有我将命令改了下 ...
ElasticSearch学习笔记(五)在logstash中配置分词器和同义词过滤器
在logstash中配置分词器和同义词过滤器 ik+pinyin分词器 同义词过滤器
Elasticsearch搜索引擎学习记录3-分词器(analyzer)应用
本人的分词器选择的是ik,感兴趣的可以尝试使用mmseg等其他热门分词器。 analyzer单词的中文译为“分析”,应用到搜索引擎就是对文字的断章取义,段的好可以说算法好,分词效果好,索引查询效率高,就es引擎来说,默认的分词器,只是简单的将文字单独分开作为索引匹配,效率低,应用较好的分词插件对于ES服务来说较有必要。 下面我简单举个例子作对比 默认 curl -XPOST “http
结合lucene索引库完成模糊查找功能(使用IK分词器)
    当数据量很大的时候,使用模糊查找,在数据库中实现是低效的,因此便出现了Lucene这样的工具。在学习制作bos系统的过程中,开始接触了这个新的知识点,当看到他的优化效率,的确是大大的提高,当然要有明显的差异性,那前提是数据量足够的大,这个技术对系统的优化起到了重要的作用。    Lucene检索原理, 会针对目标内容,先进行分词建立全文索引 ,在用户查找时,先查询索引库中词条,根据词条找到...
ElasticSearch学习笔记(二)IK分词器和拼音分词器的安装
elasticsearch IK分词器 拼音分词器
30_ElasticSearch IK分词器配置文件 以及自定义词库
ElasticSearch IK分词器配置文件 以及自定义词库更多干货分布式实战(干货)spring cloud 实战(干货)mybatis 实战(干货)spring boot 实战(干货)React 入门实战(干货)构建中小型互联网企业架构(干货)python 学习持续更新ElasticSearch 笔记一、概述ik配置文件如何自己建立词库自己建立停用词库(不想去建立索引)二、ik配置文件ik配...
centos7下elasticsearch安装以及elasticsearch的中文分词插件ik的安装步骤
centos7下elasticsearch安装以及elasticsearch的中文分词插件ik的安装步骤 一、java环境的安装 1、yum list java-1.* 查看目前系统当中是哪个java版本,笔者系统上是java-1.8.0; 2、运行命令安装java8和java8所依赖的开发环境 yum install java-1.8.0-openjdk.x86_64 java-1
ElasticSearch使用ik中文分词器集成html_strip网页标签过滤器
绝招就是使用自定义分析器可以参考官方文档    https://www.elastic.co/guide/en/elasticsearch/reference/5.6/analysis-custom-analyzer.htmltokenizerA built-in or customised tokenizer. (Required) 这个参数是必须的,分词令牌char_filterAn opti...
Elasticsearch2.X与5.X中文分词插件IK配置详解
Elasticsearch2.X与5.X中文分词插件IK配置详解 1.IK的安装与配置 首先是安装,ES安装此处不再赘述,ES对应的版本号大致对比如下 IK version ES version master 6.x -> master 6.3.0 6.3.0 6.2.4 6.2.4 6.1.3 6.1.3 5.6.8 5.6.8 5.5.3 5.5.3 ...
ElasticSearch速学 - IK中文分词器远程字典设置
前面已经对”IK中文分词器“有了简单的了解: 但是可以发现不是对所有的词都能很好的区分,比如: 逼格这个词就没有分出来。词库实际上IK分词器也是根据一些词库来进行分词的,我们可以丰富这个词库。 IK分词器(IK Analysis for Elasticsearch)给了我们一个基本的配置: https://github.com/medcl/elasticsearch-analysis-i
ElasticSearch IK中文分词使用详解
前言对于ES IK分词插件在中文检索中非常常用,本人也使用了挺久的。但知识细节一直很碎片化,一直没有做详细的整理。过一段时间用的话,也是依然各种找资料,也因此会降低开发效率。因此在有空的时候好好整理下相关资料。也希望本文对使用 ElasticSearch 和 IK分词插件的开发者有所帮助。希望能少走点弯路。本文包括前言、IK分词介绍、分词效果对比、自定义词典使用、索引设置和字段设置、查询测试
elasticsearch拼音插件安装以及(IK+pinyin使用)
/** * vm12下的centos7.2 * elasticsearch 5.2.2 */有时在淘宝搜索商品的时候, 会发现使用汉字, 拼音, 或者拼音混合汉字都会出来想要的搜索结果, 今天找了一下, 是通过拼音搜索插件实现的:1), ik的安装之前已经讲过, 不在赘述2),  es2.4版本的安装非常简单, 和ik挺像, 最后在elasticsearch.yml中加上分词配置即可, 也不再说....
ElasticSearch5.5.0 通过IK分词 建立IK映射
一、IK分词安装:(1)下载对应版本的IK分词安装包,下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases,我的ES版本为5.5.0,所以下载IK:(2)在ES集群的plugins目录下新建ik文件夹:(3)将IK的ZIP上传到新建的ik文件夹下,用unzip ***.zip 解压这个zip文件,并且将这个zip包上传到E...
阿里云上给Elasticsearch2.3.4 安装ik分词插件
安装ik分词插件Elasticsearch默认提供的分词器,会把每个汉字分开,而不是我们想要的根据关键词来分词。
文章热词 设计制作学习 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 python深度学习分词 java 深度学习分词