爬取内容中文乱码（这种“ÃºÌ¿£ºËÄ¼¾¶È¡°Ãº¡±·êÈý¡°½Ù¡±”）是怎么回事？？

用scrapy爬取新闻网站内容，结果爬下来的是一堆乱码？gb2312、utf-8、gbk各种解码都试过了还是不行！
仍然是这种乱码 Á½ÓÍÖÜÎåÊÕ¸ß µÚÈý¼¾¶ÈÕÇ·ù´´Ò»Äê¶àÒÔÀ´×î´ó

爬取的网址是：https://link.zhihu.com/?target=http%3A//www.chemall.com.cn/chemall/infocenter/newsfile/2017-10-17/20171017114532.html

储存入MongoDB也是这样

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
清源君 2019-01-15 21:33
关注
写入的时候别忘记加上 ensure_ascii=False

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

爬取内容中文乱码（这种“ÃºÌ¿£ºËÄ¼¾¶È¡°Ãº¡±·êÈý¡°½Ù¡±”）是怎么回事？？ mongodb python 数据挖掘自然语言处理
2019-01-14 21:55

回答 3 已采纳写入的时候别忘记加上 ensure_ascii=False
51单片机模块遇到的问题 51单片机 c#
2023-03-15 17:42

回答 2 已采纳你要显示的数值是希望存在light这个数组里，但这个数组实际上从未被赋值。你的conversion函数把结果存在了 ge shi bai qian wan里，但你在conversion之后居然又对这几
使用PHP将二进制转换为文件 php
2017-07-16 06:18

回答 2 已采纳 The string you're echoing looks like a plain wav stream. Just write it to a file without any decod
html 获取页面高度css,CSS½Ì³Ì£ºÈçºÎ»ñÈ¡Ò³Ãæ¿ÉÊÓÇøÓòµÄ¸ß¶È
2021-06-10 16:15

满天乱走的博客 Div+Css½Ì³Ì£º»ñÈ¡Ò³Ãæ¿ÉÊÓÇøÓòµÄ¸ß¶Èfunction getWH(){var wh = {};"Height Width".replace(/[^\s]+/g,function(a){var b = a.toLowerCase();wh[b]=window["inner".concat(a)]||...
关于数据结构栈的赋值数据结构
2015-10-16 14:54

回答 4 已采纳 s.base=(SElemType *)malloc(STACK_INIT_SIZE*sizeof(SElemType)); if(s.base=NULL) return false; 刚申请
file_get_contents（）期望参数1为字符串， php
2013-01-21 06:49

回答 1 已采纳 $_FILES['userfile'] is an array, you need to use indexes to access the specific file attributes:
captcha在localhost中工作正常，但在我的托管中没有 php
2014-11-25 05:59

回答 1 已采纳 That is the image. You're just not telling your browser that it is, your browser interprets the da
计算机病毒的危害主要体现于对计算机系统的信息破坏和,¼ÆËã»ú²¡¶¾µÄÎ£º¦Óë±íÏÖ...
2021-07-14 11:01

lithops7的博客 ¢¶Ô¼ÆËã»úÊý¾ÝÐÅÏ¢µÄÖ±½ÓÆÆ»µ×÷ÓÃ´ó²¿·Ö²¡¶¾ÔÚ¼¤·¢µÄÊ±ºòÖ±½ÓÆÆ»µ¼ÆËã»úµÄÖØÒªÐÅÏ¢Êý¾Ý£¬ËùÀûÓÃµÄÊÖ¶ÎÓÐ¸ñÊ...
以编码形式获取卷曲响应 php
2014-10-09 05:54

回答 2 已采纳 You will get same output as in your shell script with something like that : $headers = array(
生成Excel文件时出错 php
2015-04-30 10:41

回答 2 已采纳 I find the problem it was so stupid. It's just that it's not allow to put some specials characters
使用PHP显示存储在数据库中的图像 php
2014-03-24 17:29

回答 2 已采纳 As the comments suggest, storing the file location in the database is much better than storing the
扶贫计算机审计方法,ÈçºÎ×öºÃ¾«×¼·öÆ¶Éó¼Æ¹¤×÷
2021-07-28 23:30

weixin_39676242的博客 ÕªÒª£º¡°¾«×¼·öÆ¶¡±¶ÔÎÒ¹ú°ÙÄê·Ü¶·Ä¿±êµÄÊµÏÖ¾ßÓÐÖØÒªµÄÒâÒå£¬Ò²¹ØÏµµ½ÖÐ¹úÃÎµÄÊµÏÖ¡£ÐÂÐÎÊÆÏÂ¾«×¼·öÆ¶¹¤×÷...
这个扩展ASCII的一部分是什么编码？ php
2014-03-25 20:23

回答 1 已采纳 It appears to come straight from Code Page 437.
lintel潘多拉_OpenWRT¡¢LEDE¡¢ÅË¶àÀ¡¢»ªË¶¡¢Ã·ÁÖ¡¢ÀÏÃ«×ÓÇø±ðºÍÌØµãÊÇÊ²Ã´£¿...
2020-12-20 01:31

weixin_39765588的博客 2019-07-12 18:18:55ÐÂÈËÈë¿Ó¿ÆÆÕ£ºOpenWRT¡¢LEDE¡¢ÅË¶àÀ¡¢»ªË¶¡¢Ã·ÁÖ¡¢ÀÏÃ«×ÓKHsÏµÍ³Ö®¼ÒÐÂÈë¿ÓµÄÍ¬Ñ§¿Ï¶¨ÓÐ´ËÒÉÎÊ£¬ÏëË¢Ï...
如何招聘软件测试,ÈçºÎÕÐÆ¸µ½µÄÈí¼þ²âÊÔ¹¤³ÌÊ¦£¿
2021-07-22 15:24

超蜡笔的博客 ¡¡¡¡ÎÒÊÇÒ»ÃûÈí¼þ¹¤³ÌÊ¦¡£Èç¹ûÄãÏëÕÐÀ¿µ½ÎÒ£¬ÏÂÃæÊÇÒ»Ð©ÌáÊ¾¡£ÕâÐ©ÌáÊ¾¶¼ÊÇÒ»Ð©ºÜÍ¨ÓÃµÄ¼¼ÇÉ£¬¿ÉÖúÄãÕÐÆ¸µ½...
商人过河c语言编程,ÓÃµÝ¹é·¨½â¾öÉÌÈË¶ÉºÓÎÊÌâ
2021-05-21 13:13

首阳大君的博客 ¨¿ÉÒÔÊ¹³ÌÐò¼òµ¥£¬ÓÃµÝ¹é·¨½â¾öµÄn»ÊºóÎÊÌâ£¬»¹ÓÐººÅµËþÎÊÌâ£¬ÃÔ¹¬ÎÊÌâ¡£¡£¡£¡£¡£¡£ÉÌÈË¶ÉºÓÎÊÌ...
十个html标记,HTMl½Ì³Ì£º10¸ö²»³£ÓÃµÄHTML±êÇ©½éÉÜ
2021-06-14 04:55

花儿街参考的博客 HTMl½Ì³Ì£º10¸ö²»³£ÓÃµÄHTML±êÇ©½éÉÜ21ÊÓÆµ½Ì³ÌÍø——ÔÚHTMLÍõ¹úÀï£¬ÕâÀïÓÐºÜ¶à×ÓÃñ£¬Í¨³£ÎÒÃÇ¿´µ½µÄÊÇÒ»Ð©ÊìÏ¤µÄÃæ¿×...
c语言输入252则输出应该是20,2001Äê9ÔÂ¼ÆËã»úµÈ¼¶¿¼ÊÔ¶þ¼¶CÓïÑÔÉÏ»úÊÔÌâ(10¡¢11¡¢12)...
2021-05-21 17:18

寿光东骏汽车音响的博客 /*³ÌÐòÐÞ¸ÄÌâ10¸ø¶¨³ÌÐòMODI1.CÖÐº¯ÊýfunµÄ¹¦ÄÜÊÇ£ºÇó³öaËùÖ¸Êý×éÖÐ×î´óÊýºÍ´Î×î´óÊý(¹æ¶¨×î´óÊýºÍ´Î×î´óÊý²»ÔÚa[0]ºÍ...
信息系统软件测试实现后的下一步骤,ÆÊÎöÈí¼þ²âÊÔ¹ý³ÌºÍVÄ£ÐÍ
2021-07-22 18:46

Debra Resnicoff的博客 ¡¡¡¡1¡¢vÄ£ÐÍ¶Ô´íÌ½ÌÖ£¿¡¡¡¡ÐèÇó·ÖÎö ÏµÍ³²âÊÔ¡¡¡¡¡¡¸ÅÒªÉè¼Æ ¼¯³É²âÊÔ¡¡¡¡¡¡ÏêÏ¸Éè¼Æ µ¥Ôª²âÊÔ¡¡¡¡¡¡ ±àÂë¡¡.....
正确保护计算机安全的方法有哪些内容,±£»¤ÐÅÏ¢°²È«·½·¨ºÍ²ßÂÔ
2021-07-26 16:33

46497976464的博客 ½üÄêÀ´£¬°éËæ×Å»¥ÁªÍø¼¼ÊõÔÚÈ«ÇòÑ¸ÃÍ·¢Õ¹£¬ÈËÃÇÔÚÌá¹©ÁË¼«´óµÄ·½±ã£¬È»¶ø£¬ÐÅÏ¢»¯ÔÚ¸øÈËÃÇ´øÀ´ÖÖÖÖÎïÖÊºÍÎÄ...
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

爬取内容中文乱码（这种“ÃºÌ¿£ºËÄ¼¾¶È¡°Ãº¡±·êÈý¡°½Ù¡±”）是怎么回事？？

3条回答 默认 最新

悬赏问题

3条回答默认最新