单并发,用的WeNetspeech离线大模型以及libtorch1.10,rescore和search都在500ms+,为什么这么慢呢?一般TLG有多大呀?语言模型大小会很影响速度的吧?
关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
已结题
单并发,用的WeNetspeech离线大模型以及libtorch1.10,rescore和search都在500ms+,,为什么这么慢呢?一般TLG有多大呀?语言模型大小会很影响速度的吧?
收起
- 写回答
- 好问题 0 提建议
- 关注问题
微信扫一扫点击复制链接分享
- 邀请回答
- 编辑 收藏 删除
- 收藏 举报
1条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
语音之家 2022-08-02 17:51关注Search很快,rescoring一般100~200ms,WeNetSpeech模型很大,这个时间和机器性能也有关系,语言模型大小不太影响速度。
本回答被题主选为最佳回答 , 对您是否有帮助呢? 本回答被专家选为最佳回答 , 对您是否有帮助呢? 本回答被题主和专家选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏举报
微信扫一扫点击复制链接分享
评论按下Enter换行,Ctrl+Enter发表内容
报告相同问题?
提交
- 2025-03-21 09:52Elastic 中国社区官方博客的博客 我们主要关注ColPali等模型为应用带来的价值,但与E5等双编码器向量搜索相比,它们在性能上存在一定劣势。基于的示例,本文将探讨如何利用不同技术和强大的向量搜索工具,使后期交互向量适应大规模生产工作负载。...
- 2024-06-13 11:02Elastic 中国社区官方博客的博客 在本系列博文中,我们将探讨使用 Elasticsearch 在各种数据集和用例中运行大规模向量搜索的成本和性能。。该数据集包括从集合中的网页中提取的 1.38 亿个段落,使用嵌入到 1024 个维度中。对于这个实验,我们定义了...
- 2024-06-24 10:04我爱学大模型的博客 对于语言序列词ω1,ω2,ω3,…,ωn,语言模型就是计算该词序列的概率,即P(ω1,ω2,ω3,…,ωn)。
- 2025-11-19 09:18杰瑞闪记的博客 Elasticsearch 9.2 历史上首次引入 GPU 来加速向量索引的构建,整个Elastic 9.2全栈功能也发布大量重磅更新
- 2024-11-26 10:37Elastic 中国社区官方博客的博客 Elasticsearch 以 Lucene 为基础,提供了一组丰富的可扩展且经过优化的全文检索原语,包括使用 BM25 评分的词汇检索、学习稀疏检索和向量数据库。我们最近将检索器(retrievers)的概念引入了搜索 API,允许进行包括...
- 2024-08-09 09:41Elastic 中国社区官方博客的博客 作者:来自 Elastic在 8.15 中,我们的客户可以更轻松地获得出色的搜索结果。我们的最新版本带来了语义重新排名(semantic reranking)、额外的向量搜索工具和更多第三方模型提供商,并将我们的原生学习排名 ...
- 2025-08-14 18:40Elastic 中国社区官方博客的博客 首先需要安装Elasticsearch和Kibana,然后通过Python脚本将文本数据(如阿里巴巴和百度的介绍)使用Qwen3模型向量化后存入Elasticsearch。索引包含4096维的向量字段,采用余弦相似度进行搜索。通过示例展示了如何...
- 2025-08-17 08:53Hello.Reader的博客 kNN retriever是Elasticsearch Retriever框架中的首阶段召回器,用于对向量字段进行近邻搜索并返回Top-K文档。它支持多种检索策略组合,通过单次API调用完成复杂检索流程。核心参数包括field(向量字段)、query_...
- 2024-08-31 13:33Elastic 中国社区官方博客的博客 如今,用户已经开始期待根据个人兴趣定制搜索结果。...在本文中,我们将介绍个性化搜索的方法,然后以音乐偏好为例,深入探讨如何使用学习排名 (learning-to-rank: LTR) 来实现个性化搜索的具体方法。
- 2022-07-22 18:15铭毅天下的博客 1、线上问题如上所示,问题是:“把 green 这个条件放到 query 里面做一个 bool 查询,有什么不一样吗?”2、拿官方样例飞行数据举例这个问题涉及到:filter(过滤器)和 post_filter(后过滤器)的区别,我们拿官方...
- 2025-07-12 18:50risc123456的博客 • 时机:各分片先用原始查询拿到 **window 内的 Top-K**(默认 10×page_size),然后只在 **这 K 个文档** 上重新算分;- 把 **phrase proximity**、**sloppy 查询** 放在 rescore 里,避免对全量文档计算。- 用 *...
- 2021-09-26 20:41斗者_2013的博客 重新评分rescore主要用来帮助提高查询精度,通过对第一次查询返回的顶部指定数量的索引记录进行重新打分查询,避免将开销比较大的查询匹配算法应用于索引中的所有文档,从而提高查询效率,保持查询精度。
- 2022-01-10 12:57铭毅天下的博客 "min_score": 1 } } } 2.5 实现方式三:rescore 再评分实现 POST test-004/_search { "query": { "match_all": {} }, "rescore": { "window_size": 100, "query": { "rescore_query": { "function_score":...
- 2025-08-17 09:14Hello.Reader的博客 Elasticsearch 折叠查询(Collapse)功能摘要:该功能用于按指定字段去重并返回每组Top结果,支持单值keyword或数值类型字段。基础用法通过collapse.field指定分组字段,配合sort选择组代表。可展开每组结果(inner_...
- 2025-04-16 09:08Elastic 中国社区官方博客的博客 带有二值量化的向量搜索:使用 BBQ 的 Elasticsearch 比使用 FAISS 的 OpenSearch 快 5 倍。Elastic 收到了来自社区的请求,希望澄清 Elasticsearch 与 OpenSearch 在性能上的差异,特别是在语义搜索 / 向量搜索方面...
- 2025-07-16 10:24大势下的牛马的博客 摘要: Elasticsearch 9.x 通过集成 AI 技术实现语义搜索和重排序功能。语义搜索利用 NLP 模型(如 BERT)将文本转为向量,通过 knn 查询匹配相似文档;重排序则借助交叉编码器模型优化初始结果排名。用户需配置 ...
- 2025-12-23 14:05Elastic 中国社区官方博客的博客 本文介绍了Elasticsearch ES|QL中新增的向量搜索功能,包括对dense_vector字段的原生支持以及KNN函数和向量相似度函数的使用。通过创建包含3维向量的产品索引示例,演示了如何执行近似最近邻搜索(KNN)和精确搜索...
- 2023-08-22 23:14醉鱼Java的博客 es的重新评分,即在检索出来一次结果的基础上在进行检索提升数据排序效果,但是仅对查询或者post_filter阶段返回的前多少条进行二次查询。它可以根据特定的需求和业务规则,对原始查询结果进行二次排序,以提高最...
- 2021-06-02 09:22这是谁的博客?的博客 问 :rescore有什么特点? 答 : 问 :rescore如何使用? 答 : # rescore PUT /rescore_test { "mappings" : { "properties" : { "name" : {"type" : "text"} } } } # 索引 POST /rescore_test/_doc/1 { ...
- 2025-08-10 14:32Hello.Reader的博客 本文介绍了Elasticsearch中的搜索模板(Search Template)功能,它通过Mustache模板语言将搜索请求模板化存储,实现查询逻辑与业务代码的解耦。文章从基础用法、Mustache语法要点、复杂检索策略模板化到工程化落地等...
- 没有解决我的问题, 去提问