panghuahua2017 2023-01-16 23:44 采纳率: 57.1%
浏览 20
已结题

python爬虫怎么获取element元素script标签里的json?

python爬虫怎么获取element元素script标签里的json?
除了selenium,
直接请求的到的数据和元素里的不一样(请求到的数据有个)

这种动态json是什么生成逻辑?
该怎么用python请求到想要的数据呢?

img

  • 写回答

1条回答 默认 最新

  • Halifax ‎ 2023-01-17 06:50
    关注

    望采纳!!!

    
    import re
    from bs4 import BeautifulSoup
    from urllib.request import urlopen
    url = "你要解析的网页URL"
    html = urlopen(url).read()
    soup = BeautifulSoup(html,"html.parser")
    titles = soup.select("body  script") # CSS 选择器
    i = 1
    for title in titles:
        if i == 3:
         #print(title.get_text())# 标签体、标签属性
         str=title.get_text()
         break
        if i == 2:
            i = 3
        if i == 1:
            i = 2
     
    print(str)
    str1 = "\"\"\""+"<script>"+str+"</script>"+"\"\"\""
    soup = BeautifulSoup(str1, "html.parser")
    pattern = re.compile(r"var _url = '(.*?)';$", re.MULTILINE | re.DOTALL)
    script = soup.find("script", text=pattern)
    #print (pattern.search(script.text).string)
    s = pattern.search(script.text).string
    print (s.split('\'')[11])
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 5月28日
  • 已采纳回答 5月20日
  • 修改了问题 1月16日
  • 修改了问题 1月16日
  • 展开全部

悬赏问题

  • ¥15 请问Ubuntu要怎么安装chrome呀?
  • ¥15 视频编码 十六进制问题
  • ¥15 Xsheii7我安装这个文件的时候跳出来另一个文件已锁定文件的无一部分进程无法访问。这个该怎么解决
  • ¥15 unity terrain打包后地形错位,跟建筑不在同一个位置,怎么办
  • ¥15 FileNotFoundError 解决方案
  • ¥15 uniapp实现如下图的图表功能
  • ¥15 u-subsection如何修改相邻两个节点样式
  • ¥30 vs2010开发 WFP(windows filtering platform)
  • ¥15 服务端控制goose报文控制块的发布问题
  • ¥15 学习指导与未来导向啊