白夜忘川 2022-04-14 10:52 采纳率: 25%
浏览 345
已结题

Python获取div下内容

如图,想要获取评分和评分人数。其中novelreview_div具有唯一性。

img

我随便写的代码如下,有错。还望各位朋友们帮忙,感谢。

findCopywrite = re.compile(r'<div">(.*?)</div>', re.U)

soup = BeautifulSoup(html, "html.parser")
            for item in soup.find_all('div',class_='novelreview_div'):
                item = str(item)
                copywrite.append(re.findall(findCopywrite, item))
  • 写回答

1条回答 默认 最新

  • ningzip 2022-04-14 11:19
    关注

    一个取巧的方法:

    # span后面的懒得写了。。正则表达式的前后缀你可以改动一下
    list_match = re.findall(r'<span...>(.*?)</span>', re.findall(r'id="novelreview_div"(.*?)“已评分比例', html, re.S)[0])
    grade = list_match[0]
    number = list_match[1]
    

    希望能贴出代码,方便调试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 4月14日

悬赏问题

  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容