爬取静态网页，部分内容缺失，<div pathmatch = >这一块全部消失了

用的beautifulsoap，其他网站都能爬取，但这个网站不行。
这个网站用的是webp图片，标签依旧是img，可以直接查看到图片的地址，但是爬取得到的网站解析出来缺失了关键内容。
换了htmlparser，html5lib都不行。
请问能否有人能解答为什么吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-10-21 17:21
关注
题主是用requests获取网页内容？requests只能获取源代码，ajax动态生成的需要找到接口，requests请求接口获取数据。如果不是ajax动态生成，源代码里面又找不到，那么数据可能是放在js文件里面，需要找到数据文件后requests请求

要么的得用selenium来解析相关js脚本后获取数据

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

vue-vue2学习笔记
2022-08-30 14:01

No丶slovenly的博客 v-on:click.once="click('一次性事件')">一次性事件div> <div class="box" v-on:click.self="click('事件本事')">事件本事div> @scroll.passive：滚动事件 <div @scroll.passive="scroll">...div> @click.left：鼠标...
vue3+vite5前端（一）
2024-07-16 21:29

weixin_44894663的博客配置404页面最终效果： 9.1 /router/index.ts添加404静态路由导航 const routes: RouteRecordRaw[] = [ { path: '/404', name: 'NotFound', meta: { title: '404' }, component: () => import('../view/NotFound....
vue3+vite5前端（二）
2024-07-19 15:40

weixin_44894663的博客 User定义数据类型 import type { User } from '@/view/user/userType' const formatter = (row: User, column: TableColumnCtx<User>) => { switch (row.gender){ case 0: return '男' default: return '女' } } </...
angular私有模块_Angular 2身份验证：保护私有内容
2018-03-29 00:00

dingshi7798的博客 angular私有模块在本文中，我们将向Angular应用程序添加身份验证，并了解如何保护应用程序中的节免受未经授权的访问。本文是SitePoint Angular... 第1部分-启动并运行我们的Todo应用程序的第一个版本第2部分-...
Angular4.0入门
2018-04-30 00:30

weixin_30911451的博客 return this.todos.every(t => t.done); } 赋值 set toggleAll(val) { this.todos.forEach(t => t.done = val); } 路由的基本处理 ng generate module app-routing --flat --module=app 在 app-routing....
迷你5和迷你4区别_角度和d3的迷你图
2020-09-09 14:04

weixin_26736149的博客为此，您需要在根目录中打开tsconfig.json文件，并将以下内容添加到editorOptions部分中，我通常将其插入到moduleResolution的下方和importHelpers的前面。 "paths": { "~app/*": ["src/app/*"], "~assets/*": [...
规格示例_最佳角度示例
2020-08-14 10:49

cumi6497的博客 Angular具有泛型，静态类型化等功能，还有一些ES6功能。版本记录 (Version History) Google released the initial version of AngularJS on October 20, 2010. The stable release of AngularJS was on December ...
SpringBoot
2021-07-01 17:12

学无止路的博客在这一部分，我们主要了解以下3个问题：什么是SpringBoot 为什么要学习SpringBoot SpringBoot的特点 1.1 什么是SpringBoot SpringBoot是Spring项目中的一个子工程，与我们所熟知的Spring-framework 同属于spring...
Vue及Element UI&vue-element-admin简记
2019-10-14 23:45

李小白杂货铺的博客 <div v-bind:id="'list-' + id"></div>   {{ var a = 1 }} <!-- 流控制也不会生效，请使用三元...
Go语言web开发学习
2019-09-16 03:56

chuanguan1820的博客 [TOC] Go语言web开发学习写的比较早, 当时的理解可能不到位,有不对的地方,请评论告知. ...部分内容和我的另一个笔记<Golang学习笔记>有点重合,就当复习了. 基本上没有什么难度,主要内容就是些WEB方面...
Angular2 Bootstrap4 Web 开发（四）
2024-07-06 14:40

绝不原创的飞龙的博客我们必须在中更新路由配置，这样，当用户选择产品时，Angular 就会导航到/**//**/**/** ...Angular 2 有一个接口Validator让我们创建一个函数来验证邮政编码的正确性。在shared文件夹中创建文件null : {函数期望。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月21日
展开全部

爬取静态网页，部分内容缺失，<div pathmatch = >这一块全部消失了

1条回答 默认 最新

问题事件

1条回答默认最新