Life_is_Romantic
2021-07-24 11:40
采纳率: 68.8%
浏览 214
已结题

python爬取数据到文本文件:为什么里面写了utf-8还是乱码

代码里面写了utf-8

img

text文件中文还是乱码
img

附上代码:


import requests
from bs4 import BeautifulSoup

url='https://www.meishichina.com/'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36 Edg/91.0.864.71'}
def msc():
    r=requests.get(url,headers=headers)
    f=open('meisc.txt','w',encoding='utf-8')
    if r.status_code == 200:
        html=r.text
        soup=BeautifulSoup(html,'html.parser')
        data=soup.find('div',class_='w5')
        mt=data.find('div',class_='big4_list clear mt10')
        ul=mt.find('ul')
        li=ul.find_all('li')
        for item in li:
            a=item.find(target='_blank')
            title=a.attrs['title']
            href = a.attrs['href']
            f.write(f'{title}->{href}\n')
    f.close()

if __name__ == '__main__':
    msc()
  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 邀请回答

3条回答 默认 最新

相关推荐 更多相似问题