luoyanpin
2017-08-18 08:34DocumentTermMatrix wordcloud都出现乱码
R编码设置之前默认是utf-8,运行DocumentTermMatrix报错
control=list(removePunctuation=T,minDocFreq=5,wordLengths = c(1, Inf),weighting = weightTfIdf)
dtm <- DocumentTermMatrix(txt_corpus, control =control)
inspect(dtm)
<>
Non-/sparse entries: 1934534/2563634714
Sparsity : 100%
Error in nchar(Terms(x), type = "chars") :
invalid multibyte string, element 27
接着我按网上的方法,先设置Sys.setlocale(locale="English"),再执行以上代码,后设回Sys.setlocale(locale="Chinese (Simplified)_People's Republic of China.936"),没有报错,但是结果却出现了乱码,实在不知道出现什么问题了,直接将
对语料库绘制成词云,也还是乱码
- 点赞
- 回答
- 收藏
- 复制链接分享
1条回答
为你推荐
- Source insight4.0打开代码文件出现错误乱码,
- 人工智能
- c++
- 2个回答
- php curl 抓取taobao评价出现中文乱码
- php
- curl
- 阿里云
- 乱码
- 1个回答
- netty 接收16进制数据乱码
- netty 16进制数据乱码
- 3个回答
- 字符串出现乱码,c++小萌新求助
- 乱码
- c++
- 7个回答
- loadruner 11 BodyBinary 出现乱码怎样解决
- 乱码
- 图片
- loadrunner11
- 3个回答
换一换