敲不出代码还老报错的小呆瓜 2021-11-28 17:11 采纳率: 0%
浏览 32

博客爬虫能不能写一个用mongodb存储的

#博客爬虫,mongodb
目标网站:https://www.kingname.info/archives/。
将该网站的博客内容进行爬虫,包括文章标题、发布时间、文章分类、文章链接、文章正文(HTML格式)。爬取列表页第1页所有的文章标题和文章详情;要求使用MongoDB保存信息和使用Redis缓存请求;最后截取与正文相关的源代码并保存。

望博主能看到给点指点,先谢谢博主了!

  • 写回答

2条回答 默认 最新

  • CSDN专家-黄老师 2021-11-28 17:33
    关注

    python连接mongodb和写入数据也就几行代码,这网上很多教程,只要将数据转为字典格式就行了

    评论

报告相同问题?

问题事件

  • 创建了问题 11月28日

悬赏问题

  • ¥30 python代码,帮调试
  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条