祝星不再唱走马 2023-09-26 15:38 采纳率: 0%
浏览 12
已结题

爬虫如何解决空值问题


def get_url():
    url = "https://github.com/search?q=pingan&type=repositories&p=2"
    res = requests.get(url)
    name = re.findall('"hl_name":"(.*?)"',res.text)
    value = re.findall('"hl_trunc_description":"(.*?)"',res.text)
    return name,value

如图所示,我在爬取github上面的一些标题和内容,github会返回给我一个json字符串,我用正则表达式去匹配我需要的字段,但hl_trunc_description字段如下图会存在null值,re.findall函数并不会统计这些null值,我应该怎么解决这个问题?使得标题和内容能够匹配

img

  • 写回答

1条回答 默认 最新

  • cjh4312 2023-09-26 16:30
    关注

    晕 人家都给你json数据了,你用re???

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月19日
  • 创建了问题 9月26日

悬赏问题

  • ¥15 CCF-CSP 2023 第三题 解压缩(50%)
  • ¥30 comfyui openpose报错
  • ¥20 Wpf Datarid单元格闪烁效果的实现
  • ¥15 图像分割、图像边缘提取
  • ¥15 sqlserver执行存储过程报错
  • ¥100 nuxt、uniapp、ruoyi-vue 相关发布问题
  • ¥15 浮窗和全屏应用同时存在,全屏应用输入法无法弹出
  • ¥100 matlab2009 32位一直初始化
  • ¥15 Expected type 'str | PathLike[str]…… bytes' instead
  • ¥15 三极管电路求解,已知电阻电压和三级关放大倍数