小谢今天瘦了吗
2021-09-24 17:13
采纳率: 100%
浏览 35
已结题

刚开始学网络爬虫遇到了一点问题

题目:编写爬虫程序,爬取学院新闻主页中的新闻信息,包括:新闻标题,新闻时间,链接,并将这些信息转存为Excel文档。
想问问能不能提供一下思路!!

还有一个就是:
tds = tr('td')

        st0 = tds[0].string
        st4 = tds[4].string
        ulist.append([st0.strip(),tds[1].a.string,st4.strip()])

这一步不是很能理解,请大家提供一下思路,谢谢~

  • 好问题 提建议
  • 收藏

1条回答 默认 最新

  • CSDN专家-HGJ 2021-09-24 17:18
    已采纳

    1.可以尝试使用requests.get进行请求,2.使用bs4对页面进行解析,3.获取节点属性值。图中就是先获取节点tds列表,然后用索引取其中字符串值。

    已采纳该答案
    评论
    解决 无用
    打赏 举报

相关推荐 更多相似问题