• 全部
  • 关注
  • 有问必答
  • 等你来答

排行榜

  • 用户榜
  • 标签榜
  • 冲榜分奖金

频道

  • 编程语言
  • 前端
  • Java
  • Python
  • 大数据
  • 人工智能
  • 数据结构与算法
  • 嵌入式
  • 其他
  • 运维
  • 网络
  • 服务器
  • 移动开发
  • 后端
  • 开发工具
  • 微软技术
  • 硬件开发
  • 游戏
  • 吐槽问答
  • 测试
  • 小程序
  • 高考
  • PHP
  • 安全
  • 云计算
  • 开放平台
  • 软件工程
  • 设计
  • 职场和发展
  • 区块链
  • 多彩生活
  • 产品/运营
  • HarmonyOS
  • 搜索
  • 设计模式
最新最热精华悬赏待回答 筛选
  • 0

    回答

如何用python打印特定位置的单词 啊? txt文档是这样的格式Food was okay , nothing great .#[([0], [2], 'NEU'), ([0], [4, 5],

  • 1

请问如何把这个能改成基于django框架,通过web再浏览器上实现智能回答 import osimport timeimport loggingfrom collections import dequ

回答 m0_51422996
采纳率42.9%
  • 1

    回答

在使用bert的时候我遇到这个报错:requests.exceptions.HTTPError: 404 Client Error: Not Found for url: https://huggin

  • 1

    回答

在使用bert的时候出现如下错误:requests.exceptions.HTTPError: 404 Client Error: Not Found for url: https://hugging

  • 4

    回答

知识图谱这块,刚入门,有没有带我飞,把我领进门啊,是关于知识图谱这方面的算法实现等。

Suc20
采纳率0%
  • 2

输出词向量词汇中总是夹杂着编码 问题相关代码,请勿粘贴截图 from re import Aimport warningsimport gensimfrom matplotlib.pyplot im

weixin_38911685
采纳率100%
  • 2

    回答

现在短视频里存在很多虚拟人,比如柳夜熙,AYAYI,李未可,Ling等,联合各大品牌方来做市场营销,但这些虚拟人的制作成本高和周期长,普通人还无法得到。如果想探究大众对虚拟人/虚拟分身的需求,现在有多

MuObver
采纳率0%
  • 1

book="Harry Potter and the Sorcerer's Stone.txt" from nltk import word_tokenize,pos_tag #分词、词性标注f

soonwalker
采纳率75%
  • 3

short_Cases1 = ["我们伟大祖国的每一寸领土都绝对不能也绝对不可能从中国分割出去"]import jiebaimport jieba.posseg as psegimport thula

强扭的甜不瓜
采纳率85.7%
  • 1

    回答

如图,如何避免jieba分词将时间词分割开,比如 ['4', '月', '28', '日', ',', '李大钊', '在', '北京', '英勇', '就义', '。'] #希望分出来的

回答 心悦琴
采纳率87.7%
  • 4

    回答

doccano标注完的数据导出没有标注信息,label中relation和entity都是空的,后台也不报错。求解答

醐嶧
采纳率0%
  • 3

    回答

if __name__ == '__main__': fdir = '/wiki_zh_word2vec-master/wiki_zh_word2vec-master/' model

  • 2

    回答

如上图,json数据内容不一,比如第二个没有别名,那么请问该如何写能够适应这种情况呢,能建属性的都建属性,没有该内容的就不建属性,请问该如何修改,请赐教,不胜感激。下为详细代码: import os

m0_67982952
采纳率46.7%
  • 2

问题遇到的现象和发生背景 在使用chatterbot训练模型的时候,发生这个报错 问题相关代码,请勿粘贴截图 from chatterbot import ChatBotimport spacyfro

Dr.Toms
采纳率100%
  • 1

    回答

最近我在研究nlp领域,但是我一直有一个疑惑。就是现在我手中有一个有标签的训练集,一个无标签的测试集,但是还有一个很大的无标签的数据用于给我给我们作为预训练使用,但是我不理解使用无标签的数据作为预训练

回答 Thefan1
采纳率50%
  • 1

    回答

在学习文本特征提取,看了篇论文,里面处理的方法是先构建词频表,取词频大于10构建关键词表,再生成向量矩阵: 但是现在我得到嵌套列表统计得到的词频后不知道接下来要怎么弄,数据大概是这个样子 主要是想得到

  • 1

在做英文文本的自然语言处理,进行词频统计时遇到了问题前面部分形成了几种格式的数据,但如果想进行数据按行词频统计都会出现问题:1.有嵌套列表数据,如何按内部列表进行词频统计? 如有:[[a,b,c

赤点规避
采纳率66.7%
  • 2

问题遇到的现象和发生背景 代码已经写好了,一开始运行时显示缺少gensim、pandas和nltk包,后来我安装上了,但是 运行时还是报错。 问题相关代码,请勿粘贴截图 # -*- coding: u

  • 2

    回答

想问一下,nlp如何与机械相关结合,由于是机械硕士,但是走了计算机的自然语言处理,在论文上需要与机械挂钩,有什么好的想法吗?

  • nlp
  • 17
  • 2022-03-01 10:31
  • 2

大家好,现在已经jieba标注完了词性,并将标注的结果放在了新文档里。请问如何将同类词性的词语分在一起呢?

  • 1

    回答

一般的中文标注都是通过HMM或者CNN+LSTM,想知道只用CNN怎么实现词性标注。

  • 2

想用nltk库进行数据的预处理,发现数据在分词完成时还是能正常按各条数据分行的,但去停用词后全都合成了一行,这个该怎么解决呢?问题部分代码如下,都是从论坛找的,能正确运行: (前面部分清理得到数据t)

赤点规避
采纳率66.7%
  • 2

import tensorflow as tf tf.__version__ '2.2.2' import keras print(keras.__version__) 2.3.1 Us

shiter
采纳率100%
  • 1

    回答

问题遇到的现象和发生背景 应用场景:合同文本识别+数据结构化;问题:合同框架结构相同,但由于条款描述篇幅不同,导致同一个信息在合同文本出现的位置不同,但表述方式不变时,会影响该项数据的识别吗?例子:比

  • 1

现有命名实体识别任务,想使用bilstm+crf训练,打算将NER模型解耦,分解为encoder和tagger,encoder负责文本特征变换,使用bilstm,tagger负责序列标注,使用crf,

心悦琴
采纳率87.7%
  • 1

x = x.view(len(x), 1, -1) 感觉可能是因为加了这句而产生的问题,可是不加的话,又会报错 请赐教,不胜感激。

心悦琴
采纳率87.7%
  • 1

发现输入参数变量与样本数不一致:[128, 2],请问该如何处理? 请赐教,不胜感激。 代码在这👉https://github.com/Hipkevin/CoNLL-NER

心悦琴
采纳率87.7%
  • 1

    回答

import 失败,但是pip显示库已经存在路径也是对的所以到底是为什么

  • 1

    回答

问题遇到的现象和发生背景 在北京语言大学BCC语料库的词典库中,如何批量自动获取特定词条的“搭配拓展”和“义项频率”信息? 我想要达到的结果 生成特定词语的搭配信息和义项频率信息。

  • 1

    回答

求指导BERT可以计算种子词与总文本中词的相似度吗?可以的话思路是什么呀