wmdlinuxshell 2024-06-04 14:47 采纳率: 1.6%
浏览 0

python抓取图片中get下信息

  • 写回答

2条回答 默认 最新

  • 阿里嘎多学长 2024-06-04 14:47
    关注

    以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳:


    要完成这个任务,我们需要执行以下步骤:

    1. 提取图片中的文本:首先,我们需要从提供的图片中提取文本信息。这通常可以通过OCR(光学字符识别)技术实现。

    2. 解析提取的文本:一旦我们有了文本,我们可以解析它以找到URL和GET请求参数。

    3. 理解Swagger文档结构:我们需要分析Swagger文档来理解 "LCAPI.SHRApi" 接口的定义。

    4. 获取特定路径下的GET请求参数:最后,我们需要找到并解析 "/openApi/ItemCustomizedManage/GetItemKeyvalue" 路径下的GET请求参数。

    步骤1:提取图片中的文本

    Python中可以使用pytesseract库结合Google的Tesseract-OCR引擎来实现OCR。首先,你需要安装pytesseract和Tesseract-OCR。

    pip install pytesseract
    

    然后,使用以下代码来提取图片中的文本:

    import pytesseract
    from PIL import Image
    
    # 打开图片文件
    image = Image.open('b90650e3-7e06-4875-ad0d-c4b96b4845fb_909ba4b1cd9b40f89d0141ff334fc7b2.png')
    
    # 使用pytesseract进行OCR
    text = pytesseract.image_to_string(image, lang='eng')
    
    print(text)
    

    步骤2:解析提取的文本

    提取文本后,你可以使用正则表达式来找到URL和GET请求参数。

    import re
    
    # 正则表达式匹配URL和GET参数
    url_pattern = re.compile(r'https?://[^\s]+')
    params_pattern = re.compile(r'(GET)\s([^\s]+)\s(.*)')
    
    # 搜索URL和GET参数
    urls = url_pattern.findall(text)
    params = params_pattern.findall(text)
    
    for url in urls:
        print(f"Found URL: {url}")
    
    for param in params:
        print(f"Method: {param[0]}, URL: {param[1]}, Params: {param[2]}")
    

    步骤3:理解Swagger文档结构

    Swagger文档是一个用于API文档的规范,通常以JSON或YAML格式编写。你可以访问Swagger的官方文档来了解其结构:Swagger规范

    步骤4:获取特定路径下的GET请求参数

    一旦你理解了Swagger文档的结构,你可以编写代码来解析特定的API路径和其参数。这通常涉及到解析Swagger的JSON或YAML文件。

    代码实现和参考资料

    请注意,由于我无法直接访问图片文件或执行代码,你需要在你的本地环境中运行上述代码。如果你遇到任何问题或需要进一步的帮助,请随时提问。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 6月4日