超快速部分文本匹配的数据库/语言选项[关闭]

I am building a project and require a super fast way of supplying an autocomplete feed with results based on a partial text match.

I will be indexing/searching on only one field in a database, though the database row will have additional data I won't be indexing those fields. I will have approx. 25k rows.

Requirements:

Must match anywhere in the field (Lorem Ipsum Dolor Sit Amet would be found when starting to type "Lor", "Ipsum", "olor", "Sit Amet")
Needs to be extremely quick at returning results in a JSON feed (though the original source of the data doesn't matter too much)
Scalable solution for high traffic

I have reviewed a few options...

Using MongoDB like such like query in mongoDB
ElasticSearch - not sure if a bit overkill for what I need to do, and haven't seen any exaples of matching the partial text as above
SQL LIKE query, but imagine this won't be nearly fast enough?

Programming language isn't too much of an issue but Python or PHP would be preferred.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
duanchuang1935 2013-01-25 13:00
关注
As others have mentioned, a full-text index that performs linguistic and syntactic analysis (tokenizing, stemming, case and accent-normalization, etc) will give you the best results. But this won't come without a certain amount of setup and configuration.

Check out Solr's Suggester component: http://wiki.apache.org/solr/Suggester, and there is a new one - I think it's called AnalyzingSuggester or some such, which is available with Lucene only, I think, so if you want an in-memory solution you could use that (Java only though).

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

超快速部分文本匹配的数据库/语言选项[关闭] database php python
2013-01-25 12:46

回答 2 已采纳 As others have mentioned, a full-text index that performs linguistic and syntactic analysis (token
PHP上传富文本内容到数据库 php 数据库
2022-04-17 13:27

回答 1 已采纳提交到后台，后台过滤完转实体化后储存就好了
自然语言处理关于文本匹配方法 python 自然语言处理
2020-07-09 18:20

回答 1 已采纳 https://blog.csdn.net/ling620/article/details/95468908
NLP:文本匹配任务
2024-03-11 14:03

丁兰子的博客文本匹配任务是自然语言处理（NLP）领域的一个基本任务，其目标是确定两段文本之间的关系或相似度。
富文本编辑器编辑后的文字如何保存到数据库? javascript 数据库
2017-10-25 08:09

回答 10 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201710/27/1509088381_233821.png) ![图片说明](https://img-ask.cs
数据库文本中的转义字符问题数据库有问必答
2021-11-01 10:29

回答 1 已采纳这个不是数据库做的处理，是代码层面处理完后存储到数据库的。为了防止xss攻击，会对代码形式的的文本做过滤。建议你查查代码层面。
python爬取的数据写入文本快还是写入数据库快？ python
2022-09-10 09:05

回答 1 已采纳正如你说的，小数据量写入文本读写还是比较快和方便的，但是如果入库量比较大的话还是用数据库存储比较方便
MySQL核心技术原理之：数据库基础与SQL语言
2023-09-24 01:38

禅与计算机程序设计艺术的博客在IT行业，数据可谓是核心资源，如同石油一样，对于业务应用而言，数据...而作为关系型数据库的MySQL，则是最知名的开源数据库系统。那么如何正确地使用MySQL呢？理解其底层的运行原理及原理，是理解MySQL技术的关键。
数据库检索相关，提取相似文本数据库
2022-07-21 13:40

回答 6 已采纳使用分词直接根据每一个标题分词后在进行分词查询，定好分词查询的匹配度后获取匹配度超过你定好的值就是相似的。
从字符串中查找特定文本并将其与数据库匹配 mysql php
2018-12-02 10:00

回答 1 已采纳 $text="Pour 1 cup of the cream into a saucepan and add the sugar, salt. Scrape the seeds of the va
Python英语文本分析怎么匹配不同时态的单词 list python 自然语言处理
2022-05-02 13:43

回答 1 已采纳可以安装第三方分词模块，比如nltk可以实现规则动词的时态原型转换。下面是用法，打印出going的原型go from nltk.stem import SnowballStemmer trans =
【Mysql】万字长文带你快速掌握数据库基础概念及SQL基本操作
2023-07-29 13:08

东离与糖宝的博客一、数据库相关概念 1. 什么是数据库 2. 数据库的种类 3. Mysql 简介 4. SQL简介 5. 数据库中常见的数据类型二、SQL基础 1. SQL通用语法 2. SQL的主要分类 3. DDL（数据库，表，索引，视图） 4. DML...
用超文本标记语言写出这个图片 html5
2021-09-13 22:15

回答 1 已采纳写出这个图片的话，请按键盘上的f12，找到这个图片的位置复制代码即可，写出这个图片内容的话用Dreamweaver手动拖拽、取色，快的很
访问数据库的四种方式
2021-04-15 03:20

InterSystems的博客例如，对于我们的类，了解 IRIS 从 WORLDPKey2 国家/地区名称生成的索引名称后，您可以使用单个快速查询从数据库中直接加载一个对象： set countryInfo = ##class(User.world).WORLDPKey2Open("France") 同时检查：...
2021年超全超详细的最新大数据开发面试题，附答案解析
2021-02-02 14:32

五分钟学大数据的博客复习大数据面试题，看这一套就够了！持续更新中… 文章更新首发于公众号：五分钟学大数据 获取此套面试题最新pdf版，请搜索公众号【五分钟学大数据】，对话框发送面试宝典此套面试题来自于...
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

超快速部分文本匹配的数据库/语言选项[关闭]

2条回答 默认 最新

悬赏问题

2条回答默认最新