祝星不再唱走马 2023-09-26 15:38 采纳率: 0%
浏览 14
已结题

爬虫如何解决空值问题


def get_url():
    url = "https://github.com/search?q=pingan&type=repositories&p=2"
    res = requests.get(url)
    name = re.findall('"hl_name":"(.*?)"',res.text)
    value = re.findall('"hl_trunc_description":"(.*?)"',res.text)
    return name,value

如图所示,我在爬取github上面的一些标题和内容,github会返回给我一个json字符串,我用正则表达式去匹配我需要的字段,但hl_trunc_description字段如下图会存在null值,re.findall函数并不会统计这些null值,我应该怎么解决这个问题?使得标题和内容能够匹配

img

  • 写回答

1条回答 默认 最新

  • cjh4312 2023-09-26 16:30
    关注

    晕 人家都给你json数据了,你用re???

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月19日
  • 创建了问题 9月26日