hhhhaaaalllllll 2021-01-18 09:38 采纳率: 0%
浏览 8

(新手)请问是否可以实现网页批量提交pdf文件?大佬们指条明路~

形式如上~工作需要每天提交大量备案材料,目前只能一个pdf一个pdf的上传,请问能不能通过python或者插件啥的实现批量上传呢?希望老师们指个学习的方向~~谢谢!

  • 写回答

1条回答 默认 最新

  • hbcqg712 2023-11-19 18:07
    关注
    
    import os  
    import requests  
    from bs4 import BeautifulSoup  
      
    # 定义要提交的PDF文件路径和目标网页的信息  
    pdf_dir = "/path/to/pdf/files"  
    url = "http://example.com/upload"  
    username = "your_username"  
    password = "your_password"  
      
    # 遍历PDF文件目录,并对每个文件进行处理  
    for filename in os.listdir(pdf_dir):  
        if filename.endswith(".pdf"):  
            # 读取PDF文件内容  
            with open(os.path.join(pdf_dir, filename), "rb") as f:  
                pdf_content = f.read()  
      
            # 构造表单数据并提交表单  
            form_data = {  
                "username": username,  
                "password": password,  
                "file": ("file", pdf_content, "application/pdf")  # 将PDF文件作为二进制数据提交  
            }  
            response = requests.post(url, data=form_data)  
      
            # 使用BeautifulSoup解析提交后的页面,检查是否成功提交  
            soup = BeautifulSoup(response.text, "html.parser")  
            if soup.find("div", {"class": "success-message"}) is not None:  
                print(f"Successfully submitted {filename}")  
            else:  
                print(f"Failed to submit {filename}")
    

    在上面的示例中,我们首先定义了要提交的PDF文件路径和目标网页的信息。然后,我们使用os模块遍历PDF文件目录,并对每个文件进行处理。对于每个PDF文件,我们使用内置的open函数读取其内容,并将其作为表单数据提交到目标网页。我们使用requests库来执行POST请求,将表单数据提交到目标网页。提交后,我们使用BeautifulSoup库来解析提交后的页面,并检查是否成功提交。如果成功提交,则打印成功消息,否则打印失败消息。

    评论

报告相同问题?

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵