MinYaodpj 2021-12-29 17:38
浏览 11
已结题

爬取百度文库出现编码错误

问题遇到的现象和发生背景

输入txt然后复制地址进去点击回车,然后报错

问题相关代码,请勿粘贴截图

用的您发的代码

运行结果及报错内容

'gbk' codec can't decode byte 0xae in position 228: illegal multibyte sequence

我的解答思路和尝试过的方法

我有用过‘gb18030’替换‘gbk’和‘utf-8’尝试,但是结果是'gb18030' codec can't decode byte 0xa8 in position 220: illegal multibyte sequence

我想要达到的结果

不清楚问题在哪里,希望得到解答

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 1月6日
    • 创建了问题 12月29日

    悬赏问题

    • ¥15 H.264选择性加密例程
    • ¥50 windows的SFTP服务器如何能批量同步用户信息?
    • ¥15 centos7.9升级python3.0的问题
    • ¥15 如何解决调试dev-出++5.11不成功问题
    • ¥15 安装CentOS6时卡住
    • ¥20 关于#监控系统#的问题,如何解决?(相关搜索:系统软件)
    • ¥20 c语言写的8051单片机存储器mt29的模块程序
    • ¥60 求直线方程 使平面上n个点在直线同侧并且距离总和最小
    • ¥50 java算法,给定试题的难度数量(简单,普通,困难),和试题类型数量(单选,多选,判断),以及题库中各种类型的题有多少道,求能否随机抽题。
    • ¥50 rk3588板端推理