白夜忘川 2022-04-14 10:52 采纳率: 16.7%
浏览 353
已结题

Python获取div下内容

如图,想要获取评分和评分人数。其中novelreview_div具有唯一性。

img

我随便写的代码如下,有错。还望各位朋友们帮忙,感谢。

findCopywrite = re.compile(r'<div">(.*?)</div>', re.U)

soup = BeautifulSoup(html, "html.parser")
            for item in soup.find_all('div',class_='novelreview_div'):
                item = str(item)
                copywrite.append(re.findall(findCopywrite, item))
  • 写回答

1条回答 默认 最新

  • ningzip 2022-04-14 11:19
    关注

    一个取巧的方法:

    # span后面的懒得写了。。正则表达式的前后缀你可以改动一下
    list_match = re.findall(r'<span...>(.*?)</span>', re.findall(r'id="novelreview_div"(.*?)“已评分比例', html, re.S)[0])
    grade = list_match[0]
    number = list_match[1]
    

    希望能贴出代码,方便调试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 4月14日