hhhhaaaalllllll 2021-01-18 09:38 采纳率: 0%
浏览 8

(新手)请问是否可以实现网页批量提交pdf文件?大佬们指条明路~

形式如上~工作需要每天提交大量备案材料,目前只能一个pdf一个pdf的上传,请问能不能通过python或者插件啥的实现批量上传呢?希望老师们指个学习的方向~~谢谢!

  • 写回答

1条回答 默认 最新

  • hbcqg712 2023-11-19 18:07
    关注
    
    import os  
    import requests  
    from bs4 import BeautifulSoup  
      
    # 定义要提交的PDF文件路径和目标网页的信息  
    pdf_dir = "/path/to/pdf/files"  
    url = "http://example.com/upload"  
    username = "your_username"  
    password = "your_password"  
      
    # 遍历PDF文件目录,并对每个文件进行处理  
    for filename in os.listdir(pdf_dir):  
        if filename.endswith(".pdf"):  
            # 读取PDF文件内容  
            with open(os.path.join(pdf_dir, filename), "rb") as f:  
                pdf_content = f.read()  
      
            # 构造表单数据并提交表单  
            form_data = {  
                "username": username,  
                "password": password,  
                "file": ("file", pdf_content, "application/pdf")  # 将PDF文件作为二进制数据提交  
            }  
            response = requests.post(url, data=form_data)  
      
            # 使用BeautifulSoup解析提交后的页面,检查是否成功提交  
            soup = BeautifulSoup(response.text, "html.parser")  
            if soup.find("div", {"class": "success-message"}) is not None:  
                print(f"Successfully submitted {filename}")  
            else:  
                print(f"Failed to submit {filename}")
    

    在上面的示例中,我们首先定义了要提交的PDF文件路径和目标网页的信息。然后,我们使用os模块遍历PDF文件目录,并对每个文件进行处理。对于每个PDF文件,我们使用内置的open函数读取其内容,并将其作为表单数据提交到目标网页。我们使用requests库来执行POST请求,将表单数据提交到目标网页。提交后,我们使用BeautifulSoup库来解析提交后的页面,并检查是否成功提交。如果成功提交,则打印成功消息,否则打印失败消息。

    评论

报告相同问题?

悬赏问题

  • ¥15 k210烧入flash报错error:2005
  • ¥15 GIS土地利用预测FLUS模型
  • ¥15 visual studio code打不出来中文双引号
  • ¥20 关于#matlab#的问题:ps:完美符合要求有打赏(相关搜索:自适应)
  • ¥15 声音感应灯,问题出在哪里
  • ¥15 关于#matlab#的问题:(0,0)上的贝塞尔曲线,0)上的贝塞尔曲线,并使用自适应积分计算其从t=0到不大于1的任意值区间的弧长
  • ¥20 关于#r语言#rda分析作图的问题,请各位专家解答!
  • ¥50 找回 股票行情系统的资源问题
  • ¥15 gwas 分析-plink 检查人口分层出现下面问题
  • ¥15 关于#matlab#的问题:需要 MATLAB 运行程序,对比四个多址通信方式(TDMA,FDMA,CDMA,OFDMA)的抗噪声性能