白夜忘川 2022-04-14 10:52 采纳率: 25%
浏览 347
已结题

Python获取div下内容

如图,想要获取评分和评分人数。其中novelreview_div具有唯一性。

img

我随便写的代码如下,有错。还望各位朋友们帮忙,感谢。

findCopywrite = re.compile(r'<div">(.*?)</div>', re.U)

soup = BeautifulSoup(html, "html.parser")
            for item in soup.find_all('div',class_='novelreview_div'):
                item = str(item)
                copywrite.append(re.findall(findCopywrite, item))
  • 写回答

1条回答 默认 最新

  • ningzip 2022-04-14 11:19
    关注

    一个取巧的方法:

    # span后面的懒得写了。。正则表达式的前后缀你可以改动一下
    list_match = re.findall(r'<span...>(.*?)</span>', re.findall(r'id="novelreview_div"(.*?)“已评分比例', html, re.S)[0])
    grade = list_match[0]
    number = list_match[1]
    

    希望能贴出代码,方便调试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 4月14日

悬赏问题

  • ¥15 App的会员连续扣费
  • ¥15 不同数据类型的特征融合应该怎么做
  • ¥15 用proteus软件设计一个基于8086微处理器的简易温度计
  • ¥15 用联想小新14Pro
  • ¥15 multisim中关于74ls192n和DSWPK开关仿真图分析(减法计数器)
  • ¥15 基于8255的交通灯设计
  • ¥15 w3wp,exe 中发生未处理的 Microsoft ,NETFramework 异常。
  • ¥20 C51单片机程序及仿真(加减器)
  • ¥15 AQWA | 水动力分析 二阶波浪力
  • ¥15 c语言题目:成绩管理系统