python爬取数据到文本文件：为什么里面写了utf-8还是乱码

代码里面写了utf-8

text文件中文还是乱码

附上代码：


import requests
from bs4 import BeautifulSoup

url='https://www.meishichina.com/'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36 Edg/91.0.864.71'}
def msc():
    r=requests.get(url,headers=headers)
    f=open('meisc.txt','w',encoding='utf-8')
    if r.status_code == 200:
        html=r.text
        soup=BeautifulSoup(html,'html.parser')
        data=soup.find('div',class_='w5')
        mt=data.find('div',class_='big4_list clear mt10')
        ul=mt.find('ul')
        li=ul.find_all('li')
        for item in li:
            a=item.find(target='_blank')
            title=a.attrs['title']
            href = a.attrs['href']
            f.write(f'{title}->{href}\n')
    f.close()

if __name__ == '__main__':
    msc()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鸡蛋酱$ 2021-07-24 11:44
关注
你在你画圆圈的的上一行写一句r.encoding="utf-8"试一试，有用的话点一下采纳

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

utf-8 python 错误_Python爬取网页Utf-8解码错误及gzip压缩问题的解决办法
2020-12-10 08:13

weixin_39531635的博客在我们用python3爬取一些网站时，获取网页url后进行解析，在采用decode('utf-8')解码时有时候会出现utf-8无法解码的问题，比如结果会提示：Unicode Decode Error: 'utf8' codec can't decode byte 0xb2 in position ...
Python爬取数据存储到本地文本文件
2018-12-25 23:11

JiekeXu的博客前面说过Python爬取的数据可以存储到文件、关系型数据库、非关系型数据库。前面两篇文章没看的，可快速戳这里查看！https://mp.weixin.qq.com/s/A-qry4r3ymuCLXLBTF6Ccw ... 而存储到文件的数据一般都具有时效性，例如...
python中gbk转utf8_Python 处理GBK编码转UTF-8读写乱码问题
2020-12-29 22:19

weixin_40009207的博客今日写了个爬虫，爬取前程无忧的招聘信息老套路，首先获取网页源代码#-*- coding:utf-8 -*-import requestsurl = 'http://search.51job.com/jobsearch/search_result.php?'page_req = requests.get(url)page = page_...
爬取网页数据出现中文乱码 UTF-8中文乱码
2018-11-30 20:57

lbyd2016的博客在用python爬取网页数据时，获取的中文数据出现乱码情况第一种情况：没有声明编码格式，即没有进行 encoding = 'utf-8' 编码声明例如下图，在获取数据中<span> 里中文出现乱码： &...
网络爬虫-如何将爬取的Unicode码转换为中文信息-Python实例源码.zip
2022-12-13 19:26

例如，如果爬取的网页内容是以UTF-8编码的，可以这样解码： ```python import requests response = requests.get('http://example.com') content = response.content # 字节串，包含UTF-8编码的Unicode文本 ...
【Python爬虫实战】从文件到数据库：全面掌握Python爬虫数据存储技巧
2024-10-19 23:02

易辰君的博客 Python提供了多种数据存储方式，包括简单的文本文件（如.txt.csv.json），以及高级数据库（如MySQL和MongoDB）。本篇文章将深入剖析如何将爬取的数据灵活存储于不同格式和数据库中，帮助你选择最适合自己项目的存储...
下载小说时，python字符集编码utf-8和GBK的错误处理(慎！)
2024-08-24 10:57

小戴测试的博客果断花点时间，查看页面结构，写个脚本自动请求网页，获取小说内容，并进行储存到本地txt文件中，放在手机里，躺在床上慢慢看。我这里经对比页面结构和转换后的结果后，发现是引用了4个，给我默认替换成了?
python爬取数据并存到excel,python爬取数据的意义
2024-06-22 19:07

2401_85887359的博客爬虫的学习按照任务驱动的方式进行，最终实现douban电影Top250的基本信息抓取，包括电影的名称、douban评分、...能做什么我们可以爬取自己想看的视频、各种图片，只要是能够通过浏览器访问的数据都可以用它进行爬取。
浏览器里是UTF-8格式下还是乱码解决方法
2021-07-06 17:06

石韦窝窝的博客首先按f12找到控制台，输入document.charset，看返回的值，如果是utf-8那就好办 #!/usr/bin/env python # -*- coding:UTF-8 -*- import requests #实例化BeautifulSoup对象 from bs4 import BeautifulSoup ...
python字符编码使用_python2.7字符编码：首先decode(‘utf-8)然后保存的时候又encode(‘utf-8)有没有必要?...
2020-11-23 23:11

Hu??的博客 python2.7爬虫爬取一个utf-8的中文网页，为了对防止乱码首先decode(‘utf-8’)转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode(‘utf-8’)以utf-8编码保存有没有必要？1# -*-coding:...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请采纳用户回复 7月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月24日

python爬取数据到文本文件：为什么里面写了utf-8还是乱码

3条回答 默认 最新

问题事件

3条回答默认最新