Qwerthd 2023-03-07 15:40 采纳率: 71.1%
浏览 21
已结题

关于#python#的问题:但不管怎么改代码,decode和encode之类的都试了

img


我本意是想获得这段中文的,但不管怎么改代码,获得的值都是一堆乱码,decode和encode之类的都试了,还是不行诶。有没有人能看看呀


import requests
from bs4 import  BeautifulSoup

# -------------------------------------------------------------历届中国女子排球联赛获奖名单-----------------------------------------------------------------------------------

#UA伪装
headers={"user-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) A" "ppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36"
}
#1.指定爬虫网页网址
url="http://www.volleychina.org/hv/2023-01-19/doc-imyaterk5587468.shtml"

# 2.对URL发起请求
requests.get(url=url,headers=headers)

# 3.获取响应数据
response = requests.get(url=url,headers=headers)
page_txt = response.text
# page_txt.encoding='utf_8'

# 4数据解析
#通过BeautifulSoup解析数据
#① 实例化BeautifulSoup对象,将页面数据加载至对象,Fe_Re_soup为女性获奖对象
Fe_Re_soup=BeautifulSoup(page_txt,'lxml')
#② 解析url标签属性等
#将div<detail-context>标签下所有的p标签提取
p_list=Fe_Re_soup.select('.detail-context>p')
#提取所有p标签下span标签里的内容,FeRe为女性获奖对象

for i in p_list:
    print(i)

  • 写回答

3条回答 默认 最新

  • 小小小小人水豚 2023-03-07 15:59
    关注

    获取到数据后自己解码,改成下面的代码
    page_txt = response.content.decode('utf-8')

    有帮助的话,请点采纳该答案~

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月15日
  • 已采纳回答 3月7日
  • 创建了问题 3月7日

悬赏问题

  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)