君谦simg 2022-01-26 16:18 采纳率: 0%
浏览 40

Python分块 读取tsv文件为什么不成功啊?

img


代码:

import pandas as pd

reader = pd.read_csv('E:\BaiduNetdiskDownload\比赛题目使用数据\data_202106.tsv', sep='\t', encoding='gb18030', iterator=True)

loop = True

chunkSize = 1000000

chunks = []

while loop:

try:

chunk = reader.get_chunk(chunkSize)

chunks.append(chunk)

except StopIteration:

loop = False

print('Iteration is END!!!')

df = pd.concat(chunks, ignore_index=True)

print(df)

  • 写回答

2条回答 默认 最新

  • 陈年椰子 2022-01-26 16:33
    关注

    有可能不是 gb18030 的编码, 改成 utf-8试试 ?

    评论

报告相同问题?

问题事件

  • 创建了问题 1月26日

悬赏问题

  • ¥15 急,ubuntu安装后no caching mode page found等
  • ¥15 联想交换机NE2580O/NE1064TO安装SONIC
  • ¥15 防火墙的混合模式配置
  • ¥15 Ubuntu不小心注销了要怎么恢复啊
  • ¥15 win10电脑安装完plcsim advanced4.0运行时为什么会提示找不到虚拟网卡
  • ¥15 安装powerbuilder10卡在安装程序正在运行这个页面 没有下一步任何指令
  • ¥15 关于mpi的问题:请问遇到这种情况需要怎么解决,出现这个问题后电脑不能进行mpi多核运行只能进行单核运行
  • ¥50 微信聊天记录备份到电脑提示成功了,但还是没同步到电脑微信
  • ¥15 python怎么在已有视频文件后添加新帧
  • ¥20 虚幻UE引擎如何让多个同一个蓝图的NPC执行一样的动画,