m0_66671050 2023-08-29 01:34 采纳率: 33.3%
浏览 3

r语言导入csv出现报错该怎么解决呢

r语言导入csv出现报错该怎么解决呢,试了好多次都不行,不明白这个是哪里出了问题

img

  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-08-29 04:53
    关注

    【相关推荐】



    • 帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/266143
    • 你也可以参考下这篇文章:R语言打开csv文件报错处理
    • 除此之外, 这篇博客: R语言 读取csv文件 解决分割符不能正确识别导致的错位现象中的 R语言 读取csv文件 解决分割符不能正确识别导致的错位现象 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

      看到不少童鞋都遇到过类似问题。
      使用python爬取了一些微博数据,存储在csv文件中:
      已经爬取数据(存储在csv文件)
      需要导入R中进行数据清洗和绘图,使用read.csv()函数读取(下面是有问题的,最常用读取csv文件的代码):

      path = "D:/资料/eclipse/work-pace/weibo-crawler-master/weibo"
      setwd(path)
      #获得csv文件列表
      df = read.csv(file_list[1],header=F,sep = ',',comment.char = '', na.strings = '',fill = T,quote = '\"',encoding = 'UTF-8')
      # file_list是文件全目录,file_list[1]是其中一个文件的全目录
      

      读取后在Rstudio查看:
      在这里插入图片描述
      在这里插入图片描述
      前几列是正常的,但是从第10列开始出问题了,有一些分隔符被识别为了文本,出现错列。导致最后一列情感得分(grade)也出现问题(图片未展示最后一列)

      解决方案一
      把csv、txt文件用别的工具(如notepad++)转成 ansi 编码的,然后再用read.csv命令去读。
      缺陷:要手动去做
      解决方案二
      有博主指出是由于文件中文本双引号导致的问题,替换文件中的双引号为单引号即可。我没有试过,不知是否可行。
      解决方案三
      最简单的办法。直接使用fread()函数

      library(data.table)
      df = fread(file = file_list[1],encoding = 'UTF-8')  #file_list[1]是文件全目录
      

      读取后最后几列效果:
      在这里插入图片描述
      最后几列非常完美,列名也自动读出。
      附上函数的介绍:

      Fast and friendly file finagler Description: Similar to read.table but faster and more convenient. All controls such as sep,
      colClasses and nrows are automatically detected. bit64::integer64
      types are also detected and read directly without needing to read as
      character before converting.

      Dates are read as character currently. They can be converted
      afterwards using the excellent fasttime package or standard base
      functions.

      ‘fread’ is for regular delimited files; i.e., where every row has the
      same number of columns. In future, secondary separator (sep2) may be
      specified within each column. Such columns will be read as type list
      where each cell is itself a vector.


    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 创建了问题 8月29日

悬赏问题

  • ¥15 找一个QT页面+目标识别(行人检测)的开源项目
  • ¥15 有没有整苹果智能分拣线上图像数据
  • ¥20 有没有人会这个东西的
  • ¥15 cfx考虑调整“enforce system memory limit”参数的设置
  • ¥30 航迹分离,航迹增强,误差分析
  • ¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败
  • ¥15 用Ros中的Topic通讯方式控制小乌龟的速度,走矩形;编写订阅器代码
  • ¥15 LLM accuracy检测
  • ¥15 pycharm添加远程解释器报错
  • ¥15 如何让子窗口鼠标滚动独立,不要传递消息给主窗口