weixin_41758905 2018-03-06 11:07 采纳率: 0%
浏览 8364
已结题

'mbcs' codec经常出现问题

为什么用pandas 载入csv文件时总会有'mbcs' codec can't encode characters in position 0--1: invalid character
而且不是因为语言的问题# -*- coding: utf-8 -*-,
并且有的时候,同样的文件一天以后就又能读取了
pdData = pd.read_csv(r"‪C:\Users\toshiba\Desktop\LogiReg_data.txt" , names=['Exam1','Exam2','Exam3'])
Traceback (most recent call last):

File "", line 1, in
pdData = pd.read_csv(r"‪C:\Users\toshiba\Desktop\LogiReg_data.txt" , names=['Exam1','Exam2','Exam3'])

File "C:\Users\toshiba\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 562, in parser_f
return _read(filepath_or_buffer, kwds)

File "C:\Users\toshiba\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 315, in _read
parser = TextFileReader(filepath_or_buffer, **kwds)

File "C:\Users\toshiba\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 645, in init
self._make_engine(self.engine)

File "C:\Users\toshiba\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 799, in _make_engine
self._engine = CParserWrapper(self.f, **self.options)

File "C:\Users\toshiba\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1213, in init
self._reader = _parser.TextReader(src, **kwds)

File "pandas\parser.pyx", line 358, in pandas.parser.TextReader.__cinit__ (pandas\parser.c:3427)

File "pandas\parser.pyx", line 609, in pandas.parser.TextReader._setup_parser_source (pandas\parser.c:6630)

UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0--1: invalid character

  • 写回答

3条回答 默认 最新

  • threenewbee 2018-03-06 15:47
    关注

    文件中有不能识别的字符,用记事本打开,然后另存为,编码下拉框选择ansi看看

    评论

报告相同问题?

悬赏问题

  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?
  • ¥100 求三轴之间相互配合画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了