weixin_40029476 2019-01-14 21:55 采纳率: 100%
浏览 1896
已采纳

爬取内容中文乱码(这种“ú̿£ºËļ¾¶È¡°Ãº¡±·êÈý¡°½Ù¡±”)是怎么回事??

用scrapy爬取新闻网站内容,结果爬下来的是一堆乱码?gb2312、utf-8、gbk各种解码都试过了还是不行!
仍然是这种乱码 Á½ÓÍÖÜÎåÊÕ¸ß µÚÈý¼¾¶ÈÕÇ·ù´´Ò»Äê¶àÒÔÀ´×î´ó

爬取的网址是:https://link.zhihu.com/?target=http%3A//www.chemall.com.cn/chemall/infocenter/newsfile/2017-10-17/20171017114532.html

储存入MongoDB也是这样

  • 写回答

3条回答

      报告相同问题?

      相关推荐 更多相似问题

      悬赏问题

      • ¥15 uniapp实现钉钉【发起审批实例】上传文件到钉盘,后端为C#.Net处理
      • ¥15 求深信服VDI基准测试工具Sangfor DTP
      • ¥20 使用python中pandas进行数据分析
      • ¥20 使用python中pandas进行数据分析
      • ¥15 导入数据,并且以utf-8为编码格式,但是以上代码报错,求解答
      • ¥15 关于#游戏程序#的问题:端 玩wy服务器10几分钟闪退一次没有任何提示,连启动器一起闪退 本人电脑5800h 3060 16运内 win11 求解答
      • ¥15 做一个手游私服需要什么条件?
      • ¥15 关于企业微信,调用官方 微盘api 时候access_token过期的问题?
      • ¥15 请问这个C语言代码的界面怎样修改
      • ¥15 QT for Android 开发的App后台切换后卡死,没有响应