Life_is_Romantic 2021-07-24 11:40 采纳率: 68.4%
浏览 271
已结题

python爬取数据到文本文件:为什么里面写了utf-8还是乱码

代码里面写了utf-8

img

text文件中文还是乱码
img

附上代码:


import requests
from bs4 import BeautifulSoup

url='https://www.meishichina.com/'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36 Edg/91.0.864.71'}
def msc():
    r=requests.get(url,headers=headers)
    f=open('meisc.txt','w',encoding='utf-8')
    if r.status_code == 200:
        html=r.text
        soup=BeautifulSoup(html,'html.parser')
        data=soup.find('div',class_='w5')
        mt=data.find('div',class_='big4_list clear mt10')
        ul=mt.find('ul')
        li=ul.find_all('li')
        for item in li:
            a=item.find(target='_blank')
            title=a.attrs['title']
            href = a.attrs['href']
            f.write(f'{title}->{href}\n')
    f.close()

if __name__ == '__main__':
    msc()
  • 写回答

3条回答 默认 最新

  • 鸡蛋酱$ 2021-07-24 11:44
    关注

    你在你画圆圈的的上一行写一句r.encoding="utf-8"试一试,有用的话点一下采纳

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月1日
  • 已采纳回答 7月24日
  • 请采纳用户回复 7月24日
  • 创建了问题 7月24日

悬赏问题

  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 有没有帮写代码做实验仿真的
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥30 vmware exsi重置后登不上
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题
  • ¥20 yolov5自定义Prune报错,如何解决?
  • ¥15 电磁场的matlab仿真