最新最热精华悬赏待回答 筛选
  • 3

    回答

在线求解,谁可以帮我讲解一下这个HybridGraph,他的内涵是什么,我可以从哪里多了解这些东西

  • 5

    回答

Agent 框架 是否可以看作由prompt模板、flow(react / replan+react)、memory编排三部分组成?prompt 模板的效果是否需要根据不同的大模型切换不同的promp

  • 6

    回答

我要用jupyter进行依存可视化,但是from spacy import displacy失败,为什么无法导入displacy呢?有没有人可以指点

  • 3

    回答

本人学历是二本,24年毕业在某一线城市拿到12k的薪资,目前做的AI算法工程师的外包岗位,公司承诺年底给我转内部岗位。 今年在学习大模型领域的相关知识,并且公司业务也有AI智能体相关的开发路径供我实操

  • 5

    回答

硬件环境:NVIDIA A100 80GB版本:NVIDIA-SMI 550.144.03 Driver Version: 550.144.03 CUDA Version: 12.4 运

  • 5

我主要是想要做一个情感陪伴方向的AI软件,目前有一版完善的设计稿,主要有功能实现,创新设计,商业变现玩法,但开发项目方面的专业技术不够,需要一个实际做过项目,了解整个软件开发流程或者清楚创业流程的人一

陷温.564
采纳率50%
  • 4

    回答

我现在要对一段繁体中文文本进行分析。首先,我用软件提供的繁体中文词典进行分析,发现它的WPS有200多,(如图一)这个数据肯定有问题,不可能每个句子平均有200多个词。但我文本里明明有句号,这是为什么

  • 3

    回答

哪位可以帮我进行文本biber多维分析,我已收集好语料,可有偿!

回答 hfsfb
采纳率50%
  • 3

要进行英语语料的biber多维分析,现在下载了stanford postagger 和北外语料库的工具MAT,请问各位下一步要怎么操作啊

hfsfb
采纳率50%
  • 3

    回答

用LLM做时序预测大概需要的最低显卡配置要多少,像timellm,timecma这种论文

  • nlp
  • 30
  • 2025-03-14 12:29
  • 3

    回答

如图,我用的算力型号是autodl的NVIDIA L40 ,显示显存有45G,为什么还是显示显存不够?精度改成float16了,batch_size也设置为1,input output的maxleng

  • 5

    回答

请问如何获取rcv1-v2数据集的原始文本请问如何获取rcv1-v2数据集的原始文本请问如何获取rcv1-v2数据集的原始文本

  • 5

    回答

用的是llama 3.1 8B instrut。如果设置标签错位,就是标签token始终比输入后一个,那么The cat is on the mat.的ppl出来是15827,大的离谱。但是标签如果不

  • 3

    回答

我们知道在写代码时,可以通过大模型进行辅助开发,比如你在安卓端要完成一个图片轮播的样式,你问模型,模型会给你一个具体实现,这是模型通过大量的安卓代码数据的训练后生成的,但是现在是结合业务上下文生成代码

  • 1

    回答

研一小白,拿到论文代码完全不知道该怎么去复现,数据库一般是压缩包的话解压出来还是压缩包这种该怎么用!

  • 35

    回答

我的显卡是A100 80G。然后我本地用VLLM封装了3个LLM分别是3B的QwenLLM7B的QwenVL14B的QwenLLM然后3B的GPU设置为0.214B的GPU设置为0.7可以正常运行。但

  • ¥15
  • nlp
  • 879
  • 2025-01-01 02:28
2401_87554739
采纳率0%
  • 31

    回答

搭建了Ollama+AnythingLLM+Qwen2.5:7b的大模型环境,想上传一些行业标准和企业标准,以创建一个自有的本地知识库。但最终的问答结果不太好。比如:我们有多种不同类型的产品,每类产品

wind2005
采纳率20%
  • 1

    回答

鼠鼠是一个学法律的Python业余爱好者。 现在想针对一本古代案例集进行分析。现在想把整个案例集按一个案子一个案子导出,并且每个案例标记出出特定标签。(案件名称 省份,定罪,量刑,类罪,援引法律,主要

  • 2

求各位帮忙,提前感谢!在cmd(包括管理员模式)使用指令:pip install spacy时报错错误如下: Collecting spacy Using cached spacy-3.8.2.t

Elektry
采纳率100%
  • 1

在运行这里,AI修改的代码跑卡在这里不动了,是哪里错了吗,我看不出来。是Qwen2.5-7B有4个model,我导在同一个的问题,还是哪里出现问题了?求大家帮忙

Skr_20230101
采纳率100%
  • 29

    回答

请问一下,如何使用SuperGlue的四个数据集PIQA Winogrande RTE COPA来评测model的准确性?有具体步骤或者script吗?

m0_75014121
采纳率0%
  • 1

    回答

有谁知道命名实体识别算法有什么方法可以对50+的实体类型进行训练,达到高指标吗

weixin_61606472
采纳率0%
  • 1

想通过langchain和本地专业知识库构建一个问答系统,要实现读取另一个数据库的数据并进决策。

例程终结者
采纳率85.7%
  • 2

    回答

好人一生平安!有没有人知道rcv1-v2数据集中需要的rcv1.tar.xz是什么?分层多标签文本分类所有数据集都有它,但是给定的处理方式里发现了数据集里面没有的压缩包🥺

  • 2

    回答

有没有人帮我看看这段代码报错怎么解决,一运行原本385120kb的文件变成只有1kb

  • nlp
  • 7
  • 2024-06-20 10:19
  • 3

    回答

这个模型几乎预测的都是一个数据,什么过采样,类别权重loss都使用了,没什么效果。正则、dropout、学习率也使用了。

  • 2

    回答

将一任意已排序序列进行二分类满足类间方差最大与类内方差最小,求解分割阈值

  • 2

    回答

我用LDA对一类产业政策做主题聚类的时候,输出的主题-词矩阵中,每个主题下所包含的词有很多重复,而且单个主题下所包含的词很难凝聚成一个主题。大致看了一下政策文本,大多数政策对每个主题都有所涉及,比如做

  • 2

    回答

在校大学生在上深度学习时遇到的一些问题,上课时导师教了一下命名实体识别的问题,于是我自己上github找了个适合初学者的模型(附上地址:https://github.com/Determined22/

  • 5

    回答

我写了一个用hf接口进行llama2和llama3模型推理测速的脚本,测试出来结果llama2-7b比llama3-8b要更快,请问大家是怎么样测试的呢?测试结果有没有什么不一样?脚本代码如下,代码是