2301_77602568 2024-02-05 17:58 采纳率: 16.7%
浏览 3

动态网页加载。在XHR中没有可读的数据,只返回.jpg.txt文件

img


其中包含的内容应该是标签名以及详细名称,但这只返回英文和#还有*。

  • 写回答

3条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-02-05 17:59
    关注

    引自免费微信小程序:皆我百晓生

    您提到的问题是关于从一个动态加载的网页中提取数据,但通过XHR请求得到的不是JSON或其他可直接解析的数据格式,而是一个包含特殊字符(英文、# 和 *)的.jpg.txt 文件。这很可能是因为该网站采取了某种形式的数据编码或混淆策略。

    在处理这种情况时,首先需要理解这个.jpg.txt 文件的实际内容和用途:

    1. 文件内容分析

      • 检查.jpg.txt 文件的内容,确认它是否是对图片数据的文本表示(如Base64编码),或者是以特定格式编码的HTML标签和其他信息。
      • 若确实是编码过的图片数据,则需解码后查看;若为其他信息,请继续下一步。
    2. 数据提取

      • 如果这些符号和英文实际上是某种编码后的HTML结构或者其他有用数据,可能需要编写特定的解析逻辑来识别和提取所需的信息。
      • 对于自定义编码的情况,可能需要逆向工程去理解其编码规则。

    假设我们发现内容实际是混淆过的HTML标签信息,以下是一种简化的模拟解析过程(请注意这仅是一个示例,并非针对您的具体问题编写的代码):

    # 假设已读取到.jpg.txt 文件内容并存储在变量 'file_content' 中
    # 先尝试按照某种规律进行解码或解析
    
    # 示例:如果*和#作为分隔符,尝试分割字符串
    tag_and_names = file_content.split('*')  # 或者使用其他适合的分隔符
    
    for item in tag_and_names:
        # 分离出标签名和详细名称
        tag, name = item.split('#')
        
        # 进行进一步处理...
        process_tag_and_name(tag.strip(), name.strip())
    
    def process_tag_and_name(tag, name):
        # 在这里实现你的业务逻辑,比如将标签名和详细名称存入数据库或做其他操作
        pass
    

    由于实际情况未知,上述代码仅为示例,并不能直接应用到您的问题上。您需要根据实际的.jpg.txt 文件内容和其内部数据结构来调整解析方法。如果文件内容确实与图片有关且并非预期的文本信息,那么您可能需要重新审视获取数据的策略或联系网站所有者了解其API使用规范。

    评论

报告相同问题?

问题事件

  • 创建了问题 2月5日

悬赏问题

  • ¥15 BP神经网络控制倒立摆
  • ¥20 要这个数学建模编程的代码 并且能完整允许出来结果 完整的过程和数据的结果
  • ¥15 html5+css和javascript有人可以帮吗?图片要怎么插入代码里面啊
  • ¥30 Unity接入微信SDK 无法开启摄像头
  • ¥20 有偿 写代码 要用特定的软件anaconda 里的jvpyter 用python3写
  • ¥20 cad图纸,chx-3六轴码垛机器人
  • ¥15 移动摄像头专网需要解vlan
  • ¥20 access多表提取相同字段数据并合并
  • ¥20 基于MSP430f5529的MPU6050驱动,求出欧拉角
  • ¥20 Java-Oj-桌布的计算