如何爬取某里网站的数据普通的代码根本无法爬到

1 需要爬取一个某里的网站信息但是采用之前的爬虫代码得到是解析网页信息无法得到动态的数据如何解决 Java 或 php

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
renminzdb 2021-07-13 15:12
关注
爬虫对页面的处理分两种：1.完全技术性的爬取，伪造动态请求，直接获得别人的后端的数据。这个一般不是很容易处理，对某里这样的公司，这个应该不是。 2.完全客户端的爬取，通过自动化浏览器，直接进行渲染后的数据爬取。我猜你是后者，这个涉及的东西比较多，比如页面还没有渲染完，动态数据还没有填充，你爬出来就是没有数据。所以自己要了解清楚。另外，现在爬虫风险大！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

如何爬取某里网站的数据普通的代码根本无法爬到 java php 有问必答
2021-07-13 14:35

回答 3 已采纳爬虫对页面的处理分两种：1.完全技术性的爬取，伪造动态请求，直接获得别人的后端的数据。这个一般不是很容易处理，对某里这样的公司，这个应该不是。 2.完全客户端的爬取，通过自动化浏览器，直接进行渲染后的
爬虫代码没有改变每次爬取的数据不同？ python 爬虫
2021-09-19 15:55

回答 1 已采纳你应该发一发有什么错误，最佳250音乐，这本来就是可能变得，同时网络不好的时候，睡眠2秒是不够的，加上异常处理部分
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Java爬虫爬取某招聘网站招聘信息
2022-05-25 09:06

小码叔的博客 Java爬虫爬取某招聘网站招聘信息一、系统介绍二、功能展示1.需求爬取的网站内容2.实现流程2.1数据采集2.2页面解析2.3数据存储三、获取源码一、系统介绍系统主要功能：本项目爬取的XX招聘网站二、功能展示 1.需求...
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
想要爬虫自动带入EXCEL里的数据进行网络数据爬取 python 有问必答爬虫
2022-01-08 17:44

回答 1 已采纳读取时要设置一下dtype参数,同时电子表格中数据单元格应为文本格式。 import pandas as pd df=pd.read_excel('t0108.xlsx',dtype=str) pr
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
利用java定时爬取网页数据
2020-11-11 10:56

利用java定时爬取网页数据,完整爬取数据源码及jar，利用java定时爬取网页数据，可自行导入到本地测试，仅供参考
为什么爬取的网站，页面代码少了好多，然后网站显示空白 python 有问必答爬虫
2022-02-19 20:26

回答 3 已采纳你是用requests爬取网页的吗你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用s
爬取网页表格数据到excel后，excel上没有数据？ python
2023-04-10 02:32

回答 4 已采纳结论：1、你的url是错误的。至少格式上来就错了。（https://liansai.500.com/zuqiu-6296/jifen-17831/2023-04-10&page=1）；2、col2之后
爬虫代码没错却爬取失败？ python 有问必答
2021-07-20 07:59

回答 4 已采纳爬虫被封禁常见原因列表如果你一直被网站封杀却找不到原因，那么这里有个检查列表，可以帮你诊断一下问题出在哪里。首先，检查 JavaScript 。如果你从网络服务器收到的页面是空白的，缺少信息，或其
Java爬虫-使用jsoup爬取数据入门案例（爬取豆瓣电影Top250数据）
2023-08-06 16:10

丿BAIKAL巛的博客 Jsoup 是一个用于解析、提取和操作 HTML 文档的 Java 库。它提供了简单且易于使用的 API，使您能够轻松地从 HTML 页面中提取数据。Jsoup 可以加载 HTML 文档并将其解析为文档对象模型（DOM），能够轻松地遍历和操作...
java爬取网站数据时，报<strong>请开启JavaScript并刷新该页.</strong>，求解决方法 java javascript 有问必答爬虫
2022-02-09 17:25

回答 3 已采纳我遇到过两种网站是这养的,1.第一种是需要加cookie参数,加上了就可以 2.第二种就是直接使用selenium模拟浏览器
java爬虫爬取b站视频分享iframe代码并保存10000条数据到数据库
2021-07-21 22:16

q_1913284695的博客因为一个一个上传视频文件和封面图片还是很费时间的，想着直接抓取点b站上的视频iframe分享的链接和图片链接到我的数据库中，这样网站就很快就填充起来了，看着就丰满多了（单纯是为了让我开发的系统看着有数据丰满...
Java爬虫获取网页表格数据保存到MySQL
2018-06-20 16:44

Java爬虫获取网页表格数据并保存到MySQL数据库，包含完整代码
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月13日

悬赏问题

¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
¥15 java写代码遇到问题，求帮助
¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计

如何爬取 某里网站的数据 普通的代码根本无法爬到

3条回答 默认 最新

问题事件

悬赏问题

如何爬取某里网站的数据普通的代码根本无法爬到

3条回答默认最新