R语言Rwordseg包分词问题

hotel <- read.csv("D:/Download/评论.txt")
segmentCN (hotel)
edit(hotel)
segmentCN("D:/Download/评论.txt")

前两行代码报错：Error in segmentCN(hotel) : Please input character!

第三行代码数据表

第四行代码结果：[1] "D" "Download" "评论" "txt"

问：为什么不能直接读取文件来分词？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-05-01 15:18
关注
segmentCN的用法是：segmentCN(strwords, analyzer = c("default", "hmm", "jiebaR", "fmm", "coreNLP"), nature = FALSE, nosymbol = TRUE, returnType = c("vector", "tm"), ...) ，第一个参数是中文字符串向量，你直接用数据框传入当然会报错。你在读取数据后，将数据转换成一个字符串向量即可。示例：

library(Rwordseg) hotel <- read.csv("F:\\2021\\rtest\\meidi_jd.txt") for (h in hotel){ ht=paste(h) } edit(hotel) edit(ht) segmentCN(ht)
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

R语言中添加了一个自己的词典（用于分词）出现了下面的错误，怎么解决 r语言有问必答
2021-05-09 13:39

回答 3 已采纳这个报错应该是路径环境问题，你按照报错修改代码不就行了吗，最后一个翻译下意思就知道了
想知道自然语言处理分词时如何如何抉择正向最大匹配、逆向最大匹配和双向最大匹配自然语言处理
2023-01-18 07:48

回答 2 已采纳首先我们要明白：正向最大匹配是采用从左到右的方式，从句子中抽取一个子串作为一块词；逆向最大匹配是采用从右到左的方式，从句子中抽取一个子串作为一块词；而双向最大匹配是采用正向最大匹配和逆向最大匹配的结合
gensim得到的LDA主题完全一致(语言-python) python 自然语言处理
2023-02-19 17:45

回答 4 已采纳如果您使用gensim训练LDA模型，但得到的所有主题都完全一致且概率都为0.00，可能有以下几个可能的原因：参数设置不当：LDA模型有许多参数需要调整，如主题数量、迭代次数、alpha和beta等
R语言常用packages（常用R包）
2017-11-26 11:22

ZhenniLi的博客 R语言由近几年随着数据挖掘、机器学习在国内兴起而大热，现在R已经发展成为一个社区语言，有者非常多的packages支持工程应用，几乎任何问题都可以在R的packages中找到解决方案，这是R优于SPSS和SAS（模块化分析）...
python实现中文分词，jieba库实现中文分词自然语言处理
2022-11-24 22:45

回答 1 已采纳这是详细的教程https://blog.csdn.net/weixin_44095417/article/details/121146386
S7706 设置语言language-mode Chinese后显示黑框什么问题中文分词华为网络协议
2022-08-07 11:06

回答 2 已采纳登录的终端软件换换试试
请问使用jieba分词如何避免把我的时间词分开？ nlp python 自然语言处理
2022-04-29 20:27

回答 1 已采纳能不能用正则表达式先将这些筛出来，然后将其在语料中的删除，新的语料使用jieba分词，最后将两组词拼接
【R语言爬虫实战】——爬取某影评并建立主题模型（附完整代码）
2024-03-11 09:33

小墨&晓末的博客通过网络爬虫技术爬取豆瓣影评上660条《我和我对家乡》热点影评数据，接着利用**结巴分词、自己收集的停用词词典大大提高了中文分词准确性，并基于IF-IDF方法为关键词赋值权重，提高主题分类及情感分类的合理性。
nltk库分词后有多余的符号分到单词里 nlp python 自然语言处理
2022-05-06 01:36

回答 1 已采纳如果只是点无法识别的话，可以先用replace()把点替换成空格，再去分词。
怎么对Excel中的一列进行jieba分词并去停用词？ python 自然语言处理
2023-02-08 10:50

回答 1 已采纳导入pandas 用python读取excel文件，一个方法搞定，然后获取需要处理的数据列，导入jieba分词库，分词即可。停用词表网上有，循环停用词，判断分词结果中有这个停用词，就从分词结果中删除。
隐马尔科夫进行中文分词自然语言处理
2019-12-27 20:13

回答 1 已采纳 https://www.cnblogs.com/astropeak/p/9916873.html
菜鸟日记——R中装包常见错误&解决方法
2017-10-15 22:08

周末饺子配啤酒的博客装包一直是贯穿整个R的学习和使用，不过常见的情况是装包一小时，编程5分钟，陷入install.package ——error——百度——library——error——Google的死循环，最后包是装成功了but装包是为了干啥全忘了！...
最大正向匹配分词法报错求解 python 自然语言处理
2021-03-20 17:12

回答 1 已采纳 31行的new_word = [sent_length]，是创建new_word为list。如果想看new_word是否为word_dic的子集，需要循环new_word，确认是否每个元素都在word
R语言与文本挖掘入门篇（各软件包详解）-谢佳标-专题视频课程
2017-02-16 10:43

jiabiao1602的博客本课程主要是利用R语言工具实现文本挖掘。主要内容包括：1、介绍文本挖掘的基本原理；2、文本挖掘相关包的安装讲解；3、tm包和Rwordseg包的详解。
R语言 第3章 R语言常用的数据管理（2）
2020-06-18 11:59

学习记录wanxiaowan的博客正则表达其实就是对文本进行模式匹配，所有语言中的正则表达式都有一些共同的特征。我们使用help(regex)命令查看R正则表达的帮助内容。在我看来，正则表达式的主要用途有两种： ①查找特定的信息 ②查找并编辑特定...
没有解决我的问题, 去提问

悬赏问题

¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码

R语言Rwordseg包分词问题

4条回答 默认 最新

悬赏问题

4条回答默认最新