木木睡不醒 2021-07-13 14:35 采纳率: 14.3%
浏览 34
已结题

如何爬取 某里网站的数据 普通的代码根本无法爬到

1 需要爬取一个某里的网站信息 但是采用之前的爬虫代码 得到是解析网页信息 无法得到动态的数据如何解决 Java 或 php

  • 写回答

3条回答 默认 最新

  • renminzdb 2021-07-13 15:12
    关注

    爬虫对页面的处理分两种:1.完全技术性的爬取,伪造动态请求,直接获得别人的后端的数据。这个一般不是很容易处理,对某里这样的公司,这个应该不是。 2.完全客户端的爬取,通过自动化浏览器,直接进行渲染后的数据爬取。 我猜你是后者,这个涉及的东西比较多,比如页面还没有渲染完,动态数据还没有填充,你爬出来就是没有数据。所以自己要了解清楚。 另外,现在爬虫风险大!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月24日
  • 已采纳回答 8月16日
  • 创建了问题 7月13日

悬赏问题

  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计