动态网页加载。在XHR中没有可读的数据，只返回.jpg.txt文件

其中包含的内容应该是标签名以及详细名称，但这只返回英文和#还有*。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-02-05 17:59
关注
引自免费微信小程序：皆我百晓生

您提到的问题是关于从一个动态加载的网页中提取数据，但通过XHR请求得到的不是JSON或其他可直接解析的数据格式，而是一个包含特殊字符（英文、# 和 *）的.jpg.txt 文件。这很可能是因为该网站采取了某种形式的数据编码或混淆策略。

在处理这种情况时，首先需要理解这个.jpg.txt 文件的实际内容和用途：

文件内容分析：

检查.jpg.txt 文件的内容，确认它是否是对图片数据的文本表示（如Base64编码），或者是以特定格式编码的HTML标签和其他信息。
若确实是编码过的图片数据，则需解码后查看；若为其他信息，请继续下一步。

数据提取：

如果这些符号和英文实际上是某种编码后的HTML结构或者其他有用数据，可能需要编写特定的解析逻辑来识别和提取所需的信息。
对于自定义编码的情况，可能需要逆向工程去理解其编码规则。

假设我们发现内容实际是混淆过的HTML标签信息，以下是一种简化的模拟解析过程（请注意这仅是一个示例，并非针对您的具体问题编写的代码）：

# 假设已读取到.jpg.txt 文件内容并存储在变量 'file_content' 中 # 先尝试按照某种规律进行解码或解析 # 示例：如果*和#作为分隔符，尝试分割字符串 tag_and_names = file_content.split('*') # 或者使用其他适合的分隔符 for item in tag_and_names: # 分离出标签名和详细名称 tag, name = item.split('#') # 进行进一步处理... process_tag_and_name(tag.strip(), name.strip()) def process_tag_and_name(tag, name): # 在这里实现你的业务逻辑，比如将标签名和详细名称存入数据库或做其他操作 pass

由于实际情况未知，上述代码仅为示例，并不能直接应用到您的问题上。您需要根据实际的.jpg.txt 文件内容和其内部数据结构来调整解析方法。如果文件内容确实与图片有关且并非预期的文本信息，那么您可能需要重新审视获取数据的策略或联系网站所有者了解其API使用规范。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

XHR在动态网页上是如何工作的？ ajax javascript 前端
2022-03-19 09:55

回答 1 已采纳你现在说的动态网页我这边理解的意思是请求后端数据数据而后抓到后端数据页面重载？在原来的前后端不分离时，像jsp、php不分离等等，都是直接可以从表现层抓数据渲染，而不走ajax请求后续像前后端分
刚接触python爬虫，尝试爬取网页在xhr中找到url但是返回值是"" python
2021-05-11 13:49

回答 2 已采纳接口找的不对吧，你看下这是不是你要的结果： import requests import json url = "http://111.198.86.222/BAP/OpenApi" pa
python 爬取网页里面的xhr文件。 css html5 python
2019-05-07 20:14

回答 1 已采纳首先，在常规头部获取请求的url，然后查看请求方法，获取请求状态，如果是失败，就说明不是这个。然后，请求头部，将所有的headers放到requests的headers参数里面(可以包含cooki
springboot怎么返回ajax,springboot统一ajax返回数据格式，并且jquery ajax success函数修改...
2021-08-05 15:12

of soul的博客 Ajax返回数据格式 Ajax中返回数据的格式 Ajax中常见的返回数据的格式有三种:分别为文本,XML和JSON 返回的文本格式我们在上一堂课Ajax基础介绍中已经介绍过了 Ajax.php Form.html:通过 ... ajax请求原理及jquery $....
服务器向浏览器传送json数据是保存在.jons还是.txt后缀的文件里？ html5 javascript json 前端
2016-12-04 13:20

回答 1 已采纳都行，如果你返回的相应头没有text/xml，那么xhr.responseXML为null，并且responseXML是xmldom对象，不是字符串，不能用JSON.parse 操作respon
在vue里使用echarts时，数据没有渲染上去 echarts javascript vue.js
2022-03-28 11:39

回答 2 已采纳你这是重写echarts源码吗,echarts官网里面应该有类似的图表
刚开始接触vuex，login.vue文件中this.$store.state.token,总是报错——无法解析$store ajax javascript jquery vue.js
2019-11-06 19:46

回答 1 已采纳 https://blog.csdn.net/ProgramarQin/article/details/80357910
动态网页Reptile
2022-05-08 17:52

十八岁讨厌编程的博客我们在使用静态网页爬取方法的时候可能会发生一个问题，有些数据在网页开发者工具中(F12)中存在，而在网页源代码中却没有。这是因为，例如像电影评论这样的信息是瞬息万变的，可能短短数小时内就多出几百、上千条。...
为什么我在qq音乐中的xhr没有看到client_search？ python 有问必答
2022-05-24 20:43

回答 4 已采纳接口需要post请求发送数据，示例代码如下 import requests url='https://u.y.qq.com/cgi-bin/musics.fcg?_=1653400072528&si
爬虫抓取XHR文件，获取不到响应的数据 python 爬虫
2022-08-10 16:45

回答 2 已采纳你确定你的那一大串数据都是params的吗？应该是data的，或者json的吧，post方法里面有params，但是一般不是这个格式的，你的这些里面是内嵌的，params不是这样的，如果改了以后还不行
python 爬取网页的时候如何获得网页上面XHR的文件。 css javascript python
2019-04-25 22:00

回答 1 已采纳这个要完整模拟js,ajax等代码了。所以只有读取源码了解相关逻辑。你也可以直接通过请求。还有请求头来模拟http请求。
AJAX--2023.6.8
2023-06-08 19:31

weixin_65590235的博客使用 fs的writeFile来读取文件 fs.writeFile('./bbb.txt', data, (err) => { console.log(err) }) path 模块 - 路径处理建议:在 Nodejs 代码中，使用绝对路径补充: dirname 模块内置变量 (获取当前模块目录名) path...
js发送get请求，返回的是undefined javascript node.js 前端有问必答
2022-06-09 11:23

回答 3 已采纳 onreadystatechange事件中的return只是这个回调函数的返回值，并不是TB函数返回值。TB没有retun语句所以默认返回undefined。用原生xhr，可以用同步请求就能返回需要
Node.js项目总结及常用技巧
2022-07-21 15:06

旧味清欢|的博客文件依赖：一个功能可能依赖一个或多个其他文件，使用是除了引入它本身还需要考虑依赖文件，通过模块化我们只需要引入文件，无需考虑文件依赖(模块化可以帮助我们解决文件依赖问题)。可复用性：虽然粘贴复制很...
python爬虫网页中的图片_Python爬取网页中的图片（搜狗图片）详解
2020-11-22 21:09

weixin_39938855的博客因此考虑可能该元素是动态的，细心的同学可能会发现，当在网页内，向下滑动鼠标滚轮，图片是动态刷新出来的，也就是说，该网页并不是一次加载出全部资源，而是动态加载资源。这也避免了因为网页过于臃肿，而影响加载...
Node.js学习笔记
2022-06-09 09:05

抗争的小青年的博客在这一个月的学习中，又对文章进行了一次修改。在这段时间里我把一些没有意义的内容删除，又添加了我之间没有学习到的知识点，并尽量把说明放在前，案例放在后，方便大家一起学习。篇幅较长，建议大家收藏后分块阅读...
node.js基础知识
2021-10-18 14:48

土豆块嘎嘣脆的博客 ,文件类型是什么 ,文件的路径是什么 path.parse("c:/a/b/c/1.txt")//根是c:/文件类型text basename 读取文件名传入两个参数一个是文件的路径一个是文件后缀(可选) path.basename('./01text.txt')//返回 01text.txt...
js文件上传原理（form表单，FormData + XHR2 + FileReader + canvas）
2019-09-28 22:07

baoao1875的博客 FormData + XHR2 + FileReader + canvas 无刷新本地预览压缩上传实例目前实现上传的方式浏览器小于等于IE9(低版本浏览器)使用下面的方式实现的 flash实现（主流插件的方式，本文不涉及） form + iframe（项目中...
一个合格的初级前端工程师需要掌握的模块笔记
2021-02-04 09:43

掘金-我是哪吒的博客文章目录一个合格的初级前端工程师需要掌握的模块笔记前言Web模块html基本结构标签属性事件属性文本标签多媒体标签列表表格表单标签其他语义化标签网页结构模块划分CSS代码语法CSS 放置位置CSS的继承选择器的种类...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月5日

悬赏问题

¥15 BP神经网络控制倒立摆
¥20 要这个数学建模编程的代码并且能完整允许出来结果完整的过程和数据的结果
¥15 html5+css和javascript有人可以帮吗？图片要怎么插入代码里面啊
¥30 Unity接入微信SDK 无法开启摄像头
¥20 有偿写代码要用特定的软件anaconda 里的jvpyter 用python3写
¥20 cad图纸，chx-3六轴码垛机器人
¥15 移动摄像头专网需要解vlan
¥20 access多表提取相同字段数据并合并
¥20 基于MSP430f5529的MPU6050驱动，求出欧拉角
¥20 Java-Oj-桌布的计算

动态网页加载。在XHR中没有可读的数据，只返回.jpg.txt文件

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新