1 需要爬取一个某里的网站信息 但是采用之前的爬虫代码 得到是解析网页信息 无法得到动态的数据如何解决 Java 或 php
3条回答 默认 最新
- renminzdb 2021-07-13 15:12关注
爬虫对页面的处理分两种:1.完全技术性的爬取,伪造动态请求,直接获得别人的后端的数据。这个一般不是很容易处理,对某里这样的公司,这个应该不是。 2.完全客户端的爬取,通过自动化浏览器,直接进行渲染后的数据爬取。 我猜你是后者,这个涉及的东西比较多,比如页面还没有渲染完,动态数据还没有填充,你爬出来就是没有数据。所以自己要了解清楚。 另外,现在爬虫风险大!
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
- ¥15 不小心不正规的开发公司导致不给我们y码,
- ¥15 我的代码无法在vc++中运行呀,错误很多
- ¥50 求一个win系统下运行的可自动抓取arm64架构deb安装包和其依赖包的软件。
- ¥60 fail to initialize keyboard hotkeys through kernel.0000000000
- ¥30 ppOCRLabel导出识别结果失败
- ¥15 Centos7 / PETGEM
- ¥15 csmar数据进行spss描述性统计分析
- ¥15 各位请问平行检验趋势图这样要怎么调整?说标准差差异太大了
- ¥15 delphi webbrowser组件网页下拉菜单自动选择问题