Life_is_Romantic 2021-07-24 11:40 采纳率: 68.4%
浏览 272
已结题

python爬取数据到文本文件:为什么里面写了utf-8还是乱码

代码里面写了utf-8

img

text文件中文还是乱码
img

附上代码:


import requests
from bs4 import BeautifulSoup

url='https://www.meishichina.com/'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36 Edg/91.0.864.71'}
def msc():
    r=requests.get(url,headers=headers)
    f=open('meisc.txt','w',encoding='utf-8')
    if r.status_code == 200:
        html=r.text
        soup=BeautifulSoup(html,'html.parser')
        data=soup.find('div',class_='w5')
        mt=data.find('div',class_='big4_list clear mt10')
        ul=mt.find('ul')
        li=ul.find_all('li')
        for item in li:
            a=item.find(target='_blank')
            title=a.attrs['title']
            href = a.attrs['href']
            f.write(f'{title}->{href}\n')
    f.close()

if __name__ == '__main__':
    msc()
  • 写回答

3条回答 默认 最新

  • 鸡蛋酱$ 2021-07-24 11:44
    关注

    你在你画圆圈的的上一行写一句r.encoding="utf-8"试一试,有用的话点一下采纳

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月1日
  • 已采纳回答 7月24日
  • 请采纳用户回复 7月24日
  • 创建了问题 7月24日

悬赏问题

  • ¥500 高有偿提问!求优化设计微信小程序
  • ¥15 matlab在安装时报错 无法找到入口 无法定位程序输入点
  • ¥15 收益高的广告联盟有哪些
  • ¥15 Android Studio webview 的使用问题, 播放器横屏全屏
  • ¥15 删掉jdk后重新下载,Java web所需要的eclipse无法使用
  • ¥15 uniapp正式环境中通过webapi将本地数据推送到设备出现的跨域问题
  • ¥15 xui建立节点,显示错误
  • ¥15 关于#单片机#的问题:开始、复位、十进制的功能可以实现,但是切换八进制的功能无法实现(按下按键也没有效果),把初始状态调成八进制,也是八进制可以实现但是切换到十进制不行(相关搜索:汇编语言|计数器)
  • ¥15 VINS-Mono或Fusion中feature_manager中estimated_depth是特征的深度还是逆深度?
  • ¥15 谷歌浏览器如何备份抖音网页数据