woaiyibao 2019-04-26 16:05 采纳率: 64.3%
浏览 1717
已采纳

python爬虫 爬虫的网站源码不齐全怎么办

http://192.168.101.213:7027/swagger-ui.html#/26631209343164929702

用f12打开看到的源码
和用beautifulsoup get到的源码不一样 没法进行爬取

  • 写回答

1条回答 默认 最新

  • 502203305 2019-04-26 16:15
    关注

    现在都是动态网页,你爬取到的只是一个基本框架而已。
    你可以用f12 然后检测一下http请求,基本上获取到的都是第一个请求。
    后面的数据都是通过js修改后的网页。
    交互式的。所以要想做复杂爬虫,还得了解web,js,css,xpath,还有http等等。
    最开始还是找一些静态网页做实验吧。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题