hhhhaaaalllllll 2021-01-18 09:38 采纳率: 0%
浏览 8

(新手)请问是否可以实现网页批量提交pdf文件?大佬们指条明路~

形式如上~工作需要每天提交大量备案材料,目前只能一个pdf一个pdf的上传,请问能不能通过python或者插件啥的实现批量上传呢?希望老师们指个学习的方向~~谢谢!

  • 写回答

1条回答 默认 最新

  • hbcqg712 2023-11-19 18:07
    关注
    
    import os  
    import requests  
    from bs4 import BeautifulSoup  
      
    # 定义要提交的PDF文件路径和目标网页的信息  
    pdf_dir = "/path/to/pdf/files"  
    url = "http://example.com/upload"  
    username = "your_username"  
    password = "your_password"  
      
    # 遍历PDF文件目录,并对每个文件进行处理  
    for filename in os.listdir(pdf_dir):  
        if filename.endswith(".pdf"):  
            # 读取PDF文件内容  
            with open(os.path.join(pdf_dir, filename), "rb") as f:  
                pdf_content = f.read()  
      
            # 构造表单数据并提交表单  
            form_data = {  
                "username": username,  
                "password": password,  
                "file": ("file", pdf_content, "application/pdf")  # 将PDF文件作为二进制数据提交  
            }  
            response = requests.post(url, data=form_data)  
      
            # 使用BeautifulSoup解析提交后的页面,检查是否成功提交  
            soup = BeautifulSoup(response.text, "html.parser")  
            if soup.find("div", {"class": "success-message"}) is not None:  
                print(f"Successfully submitted {filename}")  
            else:  
                print(f"Failed to submit {filename}")
    

    在上面的示例中,我们首先定义了要提交的PDF文件路径和目标网页的信息。然后,我们使用os模块遍历PDF文件目录,并对每个文件进行处理。对于每个PDF文件,我们使用内置的open函数读取其内容,并将其作为表单数据提交到目标网页。我们使用requests库来执行POST请求,将表单数据提交到目标网页。提交后,我们使用BeautifulSoup库来解析提交后的页面,并检查是否成功提交。如果成功提交,则打印成功消息,否则打印失败消息。

    评论

报告相同问题?

悬赏问题

  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥15 stable diffusion
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿