最新最热精华悬赏待回答 筛选
  • 3

    回答

在复现PoG论文的时候有出现过这个404:File not found问题吗?我在运行的过程中会以一定概率出现此问题,即部分样本可以正常运行,但是每次运行会在中途某个样本出现此问题,之前部署好Free

  • 3

    回答

寻找一篇论文,内容有很多是讲怎么避免模型出现上溢下溢训练问题的,比如在pre-ln的基础上再加了一个ln,修改激活函数为relu等,最后有一句总结是这些细微的修改想一个个精密的齿轮使模型训练更加稳定之

  • 4

大二上学期即将结束,为了准备就业,我这一学期主要学习了微服务相关技术,导致《离散数学》课程基本没来得及系统学习。现在面临考试,时间紧迫,急需补课。 想请教各位有经验的博主或学长学姐: 有没有适合零基

Celestial Visionary
采纳率100%
  • 3

该如何对graphrag进行召回率测试,如何搭建测试集?怎么提升召回效果?

preyer123
采纳率100%
  • 5

    回答

请教一下各位,我在训练Word2Vec模型的时候弹出了这些提示,请问是正常情况嘛?如果不是的话,请问要如何处理呢

  • 4

    回答

DTM模型可以融合Word2vec以及对DTM模型进行TF-IDF加权或者TextRank加权,然后再融合Word2vec这是可实现的吗

  • 3

1.deepseek从算法上到底为什么可以减少对GPU的依赖?2.为什么现在豆包的使用率会比deepseek高,换言之豆包的优势在哪?3.对于大模型的投毒有哪些方面?有没有高质量的相关论文可以参考学习

  • 5

    回答

在我们所处的时代,一场以AI为核心的技术革命正席卷每个行业。许多曾依靠CRUD、业务逻辑和框架整合构建职业生涯的传统开发者,正面临前所未有的职业天花板与价值质疑。您是否也曾感到: 技术迭代的焦虑: 层

  • 4

    回答

前向传播评估阶段反回的是字典,评估函数定义的我感觉也没有问题,所有的方法我都试过了,trainer就是不运行我自定义的评估函数,运行trainer.evalute的时候也没报错,就只反回了traine

  • 5

    回答

这个问题是一个普遍现象,问下各位该如何解决,该如何恢复ai记忆要求的话希望解决方法可以用手机完成,毕竟很多时候玩ai智能体用的手机,电脑更多是生图哪方面,当然要是电脑可以解决那也不错

  • 6

    回答

想要了解ai24年初接触过sd和md的生图,由于工作关系荒废了很久有没有什么系统性的扫盲介绍,来了解一下这个新趋势需不需要学些什么语言之类的

  • 4

    回答

想要下载中科院心理研究所研发的TextMind(文心)4,官网不知道为什么一直登录不进去。想求一下TextMind(文心)最新版本和最新的SC-LIWC词典。谢谢!

  • 6

    回答

请问一下各位,想要找一个计算文本相似度的算法,我的数据是纯英文文本,大概有两千多万条没有标注的文本,有没有推荐的算法呀。目前在考虑SBERT下的预训练模型,主要包括SimCSE、all-mpnet-b

  • 4

    回答

求帮我解决一下使用pytorch完成在给定阅读理解数据集(cmrc2018)上进行微调,使模型能够完成简单的抽取式阅读理解任务,即问答任务

  • 5

    回答

最近在学习browser_use 看了很多的代码 尝试运行,均没有成功。非ui调用方式有段代码看着比较靠谱,但是报错 "ChatOpenAI" object has no field "ainvok

  • 5

    回答

我已在Ubuntu上安转了RAG-anything,也安装了ollama并拉取了llm、embedding和vl模型,如何建立本地的多模态rag?

  • 5

    回答

Mathtype:\mathbb{1}输出空心1显示异常问题 \mathbb{1}输出空心1(第一张图里的),但显示异常,为一个黑底问号。搜索csdn说设置字体MT Extra及新装字体Sti

  • 7

    回答

本人正在对kaggle上的LLM Classification Finetuning的数据进行处理,但是程序在pycharm未报错的情况下无法完全运行,未能开展数据处理

  • 4

    回答

Sherpa-onnx 怎样才能加入它官方没有提到的 onnx 模型呢?🥲之前的边端部署工作都在这里面进行的,但是需要加一个里面没有的额外功能?不能使用云端

  • 3

    回答

为什么我的本地部署的dify的chatflow没有文件上传功能,是因为ollama不支持吗?

  • 4

    回答

我在anythingllm中使用了deepseek的apikey,但是也在本地使用了知识库,放进了一些知识文库作为嵌入,这些知识文库会被上传到deepseek服务器上吗,会有泄密风险吗?

  • 3

    回答

在使用Dify建立工作流时,如何保留word文档的格式进行精确修改?在使用dify工作流编辑word文档的时候,LLM会根据上下文内容进行修改,但是最后我想要他输出修改后的文件,word的格式全部没了

  • 5

工作流中,对话模型引用知识库以后,所生成文件中的参数并没有使用传入的参数而是知识库里的落款单位和日期,应该使用我传入的参数来生成。如何解决这个问题?

  • 5

    回答

微调后的大模型在网站测试时回答非常完美,为什么量化部署到本地(转为gguf后,用ollama部署)以后跟网站上测试的差距很大啊?是精度变低了吗? 2.一些蒸馏过的模型(比如deepseek-r1-di

  • 4

    回答

用claude不得不尝的,先帮你生成代码,静态检查出错再帮你解决这个报错,再给你生成一份测试代码,自己假模假样的运行一下然后又认为有更好的实现,然后给你新建一个 原代码_高级实现.py,然后再跑一趟刚

  • 5

    回答

请问,在新闻中提取关键信息,事件发生时间、地点、参与主体等,这个您这边可以做吗

回答 山旭
采纳率0%
  • 6

    回答

问题:代码框内的#不能成功转义图1-3是我的导言区:图4是我的代码区:

回答 Ethe_
采纳率0%
  • 6

    回答

我在使用LlamaFactory微调时,已经安装了 bitsandbytes但是在WebUi选择使用量化时却提示未安装bitsandbytes。 如下图已经安装了。在这个已经安装了bitsandbyt

  • 6

    回答

做了一个中英双语平行语料术语识别的,数据量是55w个实体左右,但是连续换了很多模型acc和各个指标一直在50%左右,能怎么提高,请问各位有什么解决方法可以试试

  • 6

    回答

目前师兄给了PPUZW8810,和CUDA部分不兼容,我想在云端做文本向量化,发现有两种办法:一是在本地下载.onnx,貌似上传需要模型部署在oss创建对象,而是调用阿里云自己的API,好像两种方法都