单并发，用的WeNetspeech离线大模型以及libtorch1.10，rescore和search都在500ms+，，为什么这么慢呢？一般TLG有多大呀？语言模型大小会很影响速度的吧？

单并发，用的WeNetspeech离线大模型以及libtorch1.10，rescore和search都在500ms+，为什么这么慢呢？一般TLG有多大呀？语言模型大小会很影响速度的吧？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
语音之家 2022-08-02 17:51
关注
Search很快，rescoring一般100~200ms，WeNetSpeech模型很大，这个时间和机器性能也有关系，语言模型大小不太影响速度。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在 Elasticsearch 中扩展后期交互模型 - 第 2 部分 - 8.18
2025-03-21 09:52

Elastic 中国社区官方博客的博客我们主要关注ColPali等模型为应用带来的价值，但与E5等双编码器向量搜索相比，它们在性能上存在一定劣势。基于的示例，本文将探讨如何利用不同技术和强大的向量搜索工具，使后期交互向量适应大规模生产工作负载。...
使用 Elasticsearch 设计大规模向量搜索
2024-06-13 11:02

Elastic 中国社区官方博客的博客在本系列博文中，我们将探讨使用 Elasticsearch 在各种数据集和用例中运行大规模向量搜索的成本和性能。。该数据集包括从集合中的网页中提取的 1.38 亿个段落，使用嵌入到 1024 个维度中。对于这个实验，我们定义了...
人工和AI大语言模型成本对比 ai语音模型
2024-06-24 10:04

我爱学大模型的博客对于语言序列词ω1,ω2,ω3,…,ωn,语言模型就是计算该词序列的概率，即P(ω1,ω2,ω3,…,ωn)。
Elasticsearch 搜索性能终极优化：Rescore API 重排序原理与实战全攻略
2026-04-27 12:31

Seal^_^的博客在 Elasticsearch 海量数据搜索场景中（千万级/亿级数据），如果直接对所有匹配结果使用复杂排序（function_score、script_score），性能会极差，甚至直接OOM。为了解决**「搜索精度」与「查询性能」的矛盾**，ES ...
【Elasticsearch】function_score与rescore
2025-07-12 18:50

risc12306的博客 • 时机：各分片先用原始查询拿到 **window 内的 Top-K**（默认 10×page_size），然后只在 **这 K 个文档** 上重新算分；- 把 **phrase proximity**、**sloppy 查询** 放在 rescore 里，避免对全量文档计算。- 用 *...
单 CPU、无 GPU：如何用二进制向量 + Int8 重排序在 200ms 内搞定 4000 万文档搜索
2026-01-14 09:40

AI仙人掌的博客新方案通过分级量化策略，仅用CPU在8GB内存下实现4000万数据毫秒级检索：先用二进制向量快速粗筛（内存占用缩小32倍），再用Int8向量精细重排（精度恢复99%）。核心思想是分阶段优化——二进制排除无关数据，Int8...
Elasticsearch 9.2 都用上GPU了！性能和功能大幅提升！
2025-11-19 09:18

杰瑞闪记的博客 Elasticsearch 9.2 历史上首次引入 GPU 来加速向量索引的构建，整个Elastic 9.2全栈功能也发布大量重磅更新
介绍 Elastic Rerank：Elastic 的新语义重新排序模型
2024-11-26 10:37

Elastic 中国社区官方博客的博客 Elasticsearch 以 Lucene 为基础，提供了一组丰富的可扩展且经过优化的全文检索原语，包括使用 BM25 评分的词汇检索、学习稀疏检索和向量数据库。我们最近将检索器（retrievers）的概念引入了搜索 API，允许进行包括...
Elastic Search 8.15：通过语义文本和重新排序实现可访问的语义搜索
2024-08-09 09:41

Elastic 中国社区官方博客的博客作者：来自 Elastic在 8.15 中，我们的客户可以更轻松地获得出色的搜索结果。我们的最新版本带来了语义重新排名（semantic reranking）、额外的向量搜索工具和更多第三方模型提供商，并将我们的原生学习排名 ...
Elasticsearch：使用 LTR 进行个性化搜索
2024-08-31 13:33

Elastic 中国社区官方博客的博客如今，用户已经开始期待根据个人兴趣定制搜索结果。...在本文中，我们将介绍个性化搜索的方法，然后以音乐偏好为例，深入探讨如何使用学习排名 (learning-to-rank: LTR) 来实现个性化搜索的具体方法。
Elasticsearch 向量搜索的速度比 OpenSearch 快高达 8 倍
2026-02-26 09:44

Elastic 中国社区官方博客的博客测试使用2000万文档的电商数据集，Elasticsearch在相同配置下平均延迟更低（如100_9000_1配置下90ms vs 687ms），吞吐量更高。性能差异直接影响端到端响应时间和系统成本，使Elasticsearch成为大规模向量检索场景的...
Elasticsearch：如何使用 Qwen3 来做向量搜索
2025-08-14 18:40

Elastic 中国社区官方博客的博客首先需要安装Elasticsearch和Kibana，然后通过Python脚本将文本数据（如阿里巴巴和百度的介绍）使用Qwen3模型向量化后存入Elasticsearch。索引包含4096维的向量字段，采用余弦相似度进行搜索。通过示例展示了如何...
说说 Elasticsearch filter 和 post_filter 的区别？
2022-07-22 18:15

铭毅天下的博客 1、线上问题如上所示，问题是：“把 green 这个条件放到 query 里面做一个 bool 查询，有什么不一样吗？”2、拿官方样例飞行数据举例这个问题涉及到：filter（过滤器）和 post_filter（后过滤器）的区别，我们拿官方...
ES重新评分rescore
2021-09-26 20:41

斗者_2013的博客重新评分rescore主要用来帮助提高查询精度，通过对第一次查询返回的顶部指定数量的索引记录进行重新打分查询，避免将开销比较大的查询匹配算法应用于索引中的所有文档，从而提高查询效率，保持查询精度。
Elasticsearch 用 `collapse` 做结果去重与分组展示（含 inner\_hits、分页、重排、二级折叠）
2025-08-17 09:14

Hello.Reader的博客 Elasticsearch 折叠查询（Collapse）功能摘要：该功能用于按指定字段去重并返回每组Top结果，支持单值keyword或数值类型字段。基础用法通过collapse.field指定分组字段，配合sort选择组代表。可展开每组结果（inner_...
Elasticsearch「kNN Retriever」把向量检索装进一条 \_search 管线
2025-08-17 08:53

Hello.Reader的博客 kNN retriever是Elasticsearch Retriever框架中的首阶段召回器，用于对向量字段进行近邻搜索并返回Top-K文档。它支持多种检索策略组合，通过单次API调用完成复杂检索流程。核心参数包括field（向量字段）、query_...
Elasticsearch 问题解决方法论——你的问题是什么？
2022-01-10 12:57

铭毅天下的博客 "min_score": 1 } } } 2.5 实现方式三：rescore 再评分实现 POST test-004/_search { "query": { "match_all": {} }, "rescore": { "window_size": 100, "query": { "rescore_query": { "function_score":...
Lychee-Rerank实操手册：如何将评分结果接入Elasticsearch rescore query
2025-12-29 18:57

BIG-HO的博客本文介绍了如何在星图GPU平台上自动化部署⚖️Lychee-Rerank相关性评分工具，并将其评分结果集成到Elasticsearch的rescore query中，以优化搜索结果排序。该工具通过本地化AI模型为文档相关性打分，特别适用于电商...
Elasticsearch：使用 ES|QL 与 dense_vector 字段
2025-12-23 14:05

Elastic 中国社区官方博客的博客本文介绍了Elasticsearch ES|QL中新增的向量搜索功能，包括对dense_vector字段的原生支持以及KNN函数和向量相似度函数的使用。通过创建包含3维向量的产品索引示例，演示了如何执行近似最近邻搜索(KNN)和精确搜索...
Elasticsearch BBQ 与 OpenSearch FAISS：向量搜索性能对比
2025-04-16 09:08

Elastic 中国社区官方博客的博客带有二值量化的向量搜索：使用 BBQ 的 Elasticsearch 比使用 FAISS 的 OpenSearch 快 5 倍。Elastic 收到了来自社区的请求，希望澄清 Elasticsearch 与 OpenSearch 在性能上的差异，特别是在语义搜索 / 向量搜索方面...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月2日

单并发，用的WeNetspeech离线大模型以及libtorch1.10，rescore和search都在500ms+，，为什么这么慢呢？一般TLG有多大呀？语言模型大小会很影响速度的吧？

1条回答 默认 最新

问题事件

1条回答默认最新