m0_73521869 2023-03-08 17:25 采纳率: 78.3%
浏览 28
已结题

如何获取隐藏在网页文本中的数据呢

如何获取网页文本中的一些数字数据呢?比如一篇文章介绍了近几年来一种疾病发病率变化,我该如何在网页的文本中快速的获得这些发病率呢.

  • 写回答

4条回答 默认 最新

  • CSDN专家-sinJack 2023-03-08 17:29
    关注

    可以通过编写一个简单的程序来获取网页文本中的数字数据。使用Python编程语言,您可以使用BeautifulSoup库来解析HTML,并使用正则表达式提取数字数据。

    import requests
    from bs4 import BeautifulSoup
    import re
    
    url = 'https://example.com'   # 用您要获取数据的网页的URL代替这里的示例URL
    r = requests.get(url)
    soup = BeautifulSoup(r.content, 'html.parser')
    
    # 在文本中查找数字数据
    pattern = re.compile(r'\d+(?:\.\d+)?%?')  # 用正则表达式定义数字数据的模式
    data = [float(x) for x in pattern.findall(soup.get_text())]
    print(data)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 3月17日
  • 已采纳回答 3月9日
  • 修改了问题 3月8日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 蓝桥oj3931,请问我错在哪里
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)
  • ¥100 set_link_state
  • ¥15 虚幻5 UE美术毛发渲染