最新最热精华悬赏待回答 筛选
  • 1

    回答

有谁知道命名实体识别算法有什么方法可以对50+的实体类型进行训练,达到高指标吗

  • 1

想通过langchain和本地专业知识库构建一个问答系统,要实现读取另一个数据库的数据并进决策。

  • 2

    回答

好人一生平安!有没有人知道rcv1-v2数据集中需要的rcv1.tar.xz是什么?分层多标签文本分类所有数据集都有它,但是给定的处理方式里发现了数据集里面没有的压缩包🥺

  • 2

    回答

有没有人帮我看看这段代码报错怎么解决,一运行原本385120kb的文件变成只有1kb

  • nlp
  • 6
  • 2024-06-20 10:19
  • 3

    回答

这个模型几乎预测的都是一个数据,什么过采样,类别权重loss都使用了,没什么效果。正则、dropout、学习率也使用了。

  • 2

    回答

将一任意已排序序列进行二分类满足类间方差最大与类内方差最小,求解分割阈值

  • 2

    回答

我用LDA对一类产业政策做主题聚类的时候,输出的主题-词矩阵中,每个主题下所包含的词有很多重复,而且单个主题下所包含的词很难凝聚成一个主题。大致看了一下政策文本,大多数政策对每个主题都有所涉及,比如做

  • 2

    回答

在校大学生在上深度学习时遇到的一些问题,上课时导师教了一下命名实体识别的问题,于是我自己上github找了个适合初学者的模型(附上地址:https://github.com/Determined22/

  • 5

    回答

我写了一个用hf接口进行llama2和llama3模型推理测速的脚本,测试出来结果llama2-7b比llama3-8b要更快,请问大家是怎么样测试的呢?测试结果有没有什么不一样?脚本代码如下,代码是

  • 6

    回答

对数据进行清洗,得到了cleaned_text,形式如下:想要对cleaned_text这一列的文本进行分词,之后探究整个文本里词频最高的前十五个单词,根据网上找的代码如下: for cyber_ty

  • 5

    回答

windows11,PyCharm,cuda12.3,python3.8。pytorch和requirements里的依赖都装好了。 训练完全权重模型需要安装deepspeed,怎么装都报错(用了镜

  • 5

    回答

chatglm2-6b puning微调训练后,运行web_demo.py生成的页面(基于gradio如下图一),想调用它的api,但代码里这个json文件路径的参数(如图二)实在不知道填什么,填什

  • 7

怎么获取下面的: glove_word2id.json和 glove_numpy.npy 这两个文件 def load_glove_embeddings(self, data_word2id

梦屿南笙
采纳率50%
  • 5

    回答

Executing: rm -f /home/dbwen/moses/working/train/model/phrase-table.half.* (7) learn reordering mod

  • nlp
  • 2
  • 2024-04-16 10:22
  • 2

    回答

您好,很抱歉打扰您。有一个关于T5模型的问题想请教您一下!使用T5模型调用gen_seqs = accelerator.unwrap_model(model).generate(**batch['co

  • 3

    回答

在python程序中,使用T5模型调用generate函数后,在其#4的input_ids得到返回值tensor([[0],\n [o],\n[0],\n[0]], device='cuda:0')。

  • 1

    回答

不知道为什么会出现这个问题,是需要更新pip么?还是说其他问题,感觉根据doccano的安装教程来安装,然后出现了上面的问题。

  • nlp
  • 9
  • 2024-04-06 18:35
  • 5

如何对文本进行向量化,我改怎么确定每句话有多长呢?向量化后如何检索

qq_26083679
采纳率69.2%
  • 5

    回答

一张卡和八张卡一样的速度是不是因为数据集在硬盘上读取速度问题多线程也调了哪里需要更改 # ------------------------------------------------------

  • 1

目前在自学大模型应用,方向是AI辅助编码,有没有好人提示一下知识树和学习顺序,多谢

zhyuli
采纳率100%
  • 2

    回答

在学习使用langchain,但是照着例子打下来为什么invoke那无法得到答案啊,希望有朋友帮帮我

  • 2

PaddleNLP 无监督智能检索问答系统 基于elasticsearch 搭建中文问答系统时出现错误 按照教程 https://github.com/PaddlePaddle/PaddleNLP/t

大铁锤按摩
采纳率66.7%
  • 18

    回答

PaddleNLP 无监督智能检索问答系统 基于elasticsearch 搭建中文问答系统时出现错误 按照教程 https://github.com/PaddlePaddle/PaddleNL

大铁锤按摩
采纳率66.7%
  • 11

    回答

按照在CSDN上看到的使用stanford parser的方法尝试了一下,发现报错 不知道如何处理,请求帮助--更新----还是没有解决,打算跳过parse这个功能,直接用句法依存即depende

weixin_58719779
采纳率62.5%
  • 19

    回答

NLP怎么提取word文档里面的数学公式呢 比如这种,里面的方程组是图片,前面的文字不是,需要提取出两个方程 再比如这种,两个大的三角形是图片,需要提取出三角形

YeFeiji
采纳率0%
  • 4

【人工智能 | ChatGPT 和文心一言哪个更好用? - CSDN App】http://t.csdnimg.cn/ejG4N

  • 1

    回答

OSError: We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the

  • 1

    回答

做文本生成任务微调大模型是选base版本还是选chat版本?不考虑多轮对话,只用输入输出格式

  • 2

    回答

raceback (most recent call last): File "d:\tempinformation\ConferenceSummary\train.py", line 129,

  • 2

    回答

大模型小bai,四张卡推理,加载模型时 ```python model = AutoModelForCausalLM.from_pretrained(model_name_or_path, torc