阿Sir永不为奴 2019-08-02 12:04 采纳率: 0%
浏览 1426

python 爬虫怎么保存正文的图片且保留相应位置?

学习爬虫,这问题研究了下.不知道怎么保存了.

比如:
这样的

图片说明

如果用 xpath .text只能获取文本..
后来我想了用 遍历每排元素的方式
发现 img 标签没法搞了. 因为没有文本 直接会跳过.

所以请教下..怎么保存原来的 文章格式..特别是图片穿插的位置..如何保存呢.谢谢..

或者你们用的什么方法呢..谢谢.

  • 写回答

1条回答 默认 最新

  • 关注

    把那一段的标签内容全部拿下来,遍历所有标签的内容,判断是否带有图片的标签。 如果带有就拿图片链接 如果没有就拿文章text 再插入到一个列表里面 这样就是按照原文的格式保存下来

    评论

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题