程序使用了大量的/tmp空间

我有一个Ubuntu linux 的服务器我想在上面每小时运行我的爬虫程序（用到了selenium chromedriver）.程序会打开不同产品网页（大约1p00个），输入不同的邮编（100个）然后爬取价格。
但当我在服务器上运行几个小时后，服务器的人联系我说我的运行程序消耗了大量的 /tmp 空间（ free space: / 3765 MB (53% inode=70%): /home 699 MB (81% inode=99%): /opt 1169 MB (43% inode=99%): /tmp 25 MB (1% inode=55%): /usr/local 819 MB (95% inode=99%): /var 5957 MB (78% inode=99%):）。请问这是怎么回事

这是我的代码：

urlList = [........]#省略url
data = read_csv("C:\\Users\\12987\\desktop\\zipcode\\zc.csv")
# converting column data to list
zipCodeList = data['Zipcode'].tolist()
 
while(True):
    AArray = []
 
    def ScrapingTarget(url):
        wait_imp = 10
        CO = webdriver.ChromeOptions()
        CO.add_experimental_option('useAutomationExtension', False)
        CO.add_argument('--ignore-certificate-errors')
        CO.add_argument('--start-maximized')
        wd = webdriver.Chrome(chrome_options=options, executable_path="/usr/bin/chromedriver")
        wd.get(url)
        wd.implicitly_wait(wait_imp)
 
        for zipcode in zipCodeList:
            # click the My Store
            myStore = wd.find_element(by=By.XPATH, value="//*[@id='web-store-id-msg-btn']/div[2]/div")
            myStore.click()
            sleep(0.5)
 
            #input ZipCode
            inputZipCode = wd.find_element(by=By.XPATH, value="//*[@id='zip-or-city-state']")
            inputZipCode.clear()
            inputZipCode.send_keys(zipcode)
 
            #click lookup
            clickLoopUP = wd.find_element(by=By.XPATH, value="//*[@id='overlay-1']/div[2]/div[1]/div/div[3]/div[2]/button")
            clickLoopUP.click()
            sleep(0.5)
 
            #choose Store
            store = wd.find_element(by=By.XPATH, value="//*[@id='overlay-1']/div[2]/div[3]/div[2]/div[1]/button")
            store.click()
 
            #start scraping
            name = wd.find_element(by=By.XPATH, value="//*[@id='pageBodyContainer']/div[1]/div[1]/h1/span").text
            #nameArray.append(name)
 
            price = wd.find_element(by=By.XPATH, value="//*[@id='pageBodyContainer']/div[1]/div[2]/div[2]/div/div[1]/div[1]/span").text
            #priceArray.append(price)
 
            currentZipCode = zipcode
            #zipCodeArray.append(currentZipCode)
 
            tz = pytz.timezone('Europe/London')
            GMT = datetime.now(tz).strftime("%Y-%m-%d %H:%M:%S")
            #GMTArray.append(GMT)
 
            # needed to click onto the "Show more" to get the tcin and upc
            xpath = '//*[@id="tabContent-tab-Details"]/div/button'
            element_present = EC.presence_of_element_located((By.XPATH, xpath))
            WebDriverWait(wd, 5).until(element_present)
            showMore = wd.find_element(by=By.XPATH, value=xpath)
            sleep(2)
            showMore.click()
            soup = BeautifulSoup(wd.page_source, 'html.parser')
            # gets a list of all elements under "Specifications"
            div = soup.find("div", {"class": "styles__StyledCol-sc-ct8kx6-0 iKGdHS h-padding-h-tight"})
            list = div.find_all("div")
            for a in range(len(list)):
                list[a] = list[a].text
            # locates the elements in the list
            tcin = [v for v in list if v.startswith("TCIN")]
            upc = [v for v in list if v.startswith("UPC")]
            #TCIN.append(tcin)
            #UPC.append(upc)
 
            #scroll up
            #wd.find_element_by_tag_name('body').send_keys(Keys.CONTROL + Keys.HOME)
            wd.find_element(by=By.TAG_NAME, value='body').send_keys(Keys.CONTROL + Keys.HOME)
 
            AArray.append([name, price, currentZipCode, tcin, upc, GMT])
 
 
    with concurrent.futures.ThreadPoolExecutor(10) as executor:
         executor.map(ScrapingTarget, urlList)
 
    with open(r'/home/misakkka/export_Target_dataframe.csv',,
              'a', newline="", encoding='utf-8') as f:
        writer = csv.writer(f)
        writer.writerows(AArray)
 
    sleep(3600)

我觉得driver.quit()和driver.close()可能会有用但不敢尝试
希望能顺利每小时都运行这个程序

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
一切因为有你 2022-05-30 12:08
关注
你一小时执行一次，应该用定时脚本运行，你这个相当于程序一直运行没停，而且也没关闭，内存都没释放

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

pip安装任何包都会报错Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-* centos linux python
2021-10-10 20:28

回答 9 已采纳应该是把系统自带的python软链接修改带来的后果
rm -rf /tmp之后无法在此目录下创建文件 centos linux ubuntu
2020-03-05 18:11

回答 1 已采纳因为你把当前目录和上级目录都删除了，你可以回到根目录看看，这个时候的tmp目录已经没有了每个目录下都有一个隐藏的.和..两个目录，表示当前目录和上级目录，你的rm -rf /tmp/ 是把这个目录
用pdb调试python加断点出现问题 python
2022-09-05 12:08

回答 1 已采纳因为a=1还没有执行，可以试试再pdb命令行输入n，回车，然后再 p a，多试几次
python中tmp的用法_使用Python selenium调用phantomjs 后会在/tmp下产生大量的tmp缓存文件，如何关闭？...
2020-12-23 11:42

weixin_39541212的博客使用Python selenium调用phantomjs 后会在/tmp下产生大量的tmp缓存文件，文件无内容，但是占用大量系统资源，phantomjs如何关闭此类缓存文件？由于程序是每小时启动一次，因此每天会产生很多此类tmp文件，除了手动...
为什么goapp test在/ tmp中寻找文件？
2017-06-16 14:56

回答 3 已采纳 You can try and follow the recommendation of this answer: If your install is messed up beyond
请教android 6.0如何在系统的/tmp目录创建文件 android
2021-09-24 15:12

回答 1 已采纳对Android的根目录操作必须要有root权限才行，相当于Linux下的超级管理员或者Windows下的Administrator权限。
我想删除一个非空的子目录，用rm -rf /tmp删除时显示设备或资源忙是什么原因？ linux
2021-07-14 11:05

回答 2 已采纳可能是后台还挂载着还在运行的程序，先ps查看一下，有的话kill -9 杀死后再删
利用python程序帮大家清理windows垃圾
2020-09-21 11:15

要编写一个Python程序来清理这些文件，我们需要使用`os`模块来处理文件和目录。以下是一些关键步骤： 1. **获取文件地址**： - 使用`os.getcwd()`获取当前工作目录。 - 使用`os.chdir()`改变工作目录。 - `os....
Linux在/ tmp中创建文件test将它文件访问权限设置为766 linux
2021-11-11 11:20

回答 1 已采纳 cd /tmptouch test.txtchmod 776 test.txt这不是基础命令吗？有啥好问的，自己去翻翻linux基础命令即可 Linux基础学习四：Lin
Python如何在程序最后获取控制台输出内容？ python
2022-12-17 16:37

回答 2 已采纳已解决。解决方法如下： class Logger(object): def __init__(self, filename='default.log', stream=sys.stdout)
/var/tmp下面的问文件夹有用吗？删除可以吗？ c++ java linux
2022-10-18 18:46

回答 1 已采纳 Linux有两个公知的临时目录：/tmp与/var/tmp，这两个目录被用户用于存储临时性的文件，亦经常被程读写用户存储临时性数据。可以删除
python 微信公众号，微信小程序wechatpy的使用
2022-09-06 10:49

办法总比困难多多的博客随着人工智能的不断发展，微信开发也越来越重要，很多人都开启了学习...以上就是今天要讲的内容，本文仅仅简单介绍了wechatpy的使用，而wechatpy提供了大量能使我们快速便捷地处理微信公众号，微信小程序的函数和方法。
【Python八股文系列】：100个Python的面试/笔试高频考点
2022-09-12 20:55

奋斗的西瓜瓜的博客本文主要整理了关于Python的面试/笔试的一些考点，可用于查漏补缺。
Python 模块使用
2022-10-24 20:23

sankgao的博客 Python 模块使用
Pyro简介贝叶斯神经网络bnn , 隐马尔可夫模型人工智能python python 概率分布程序包的使用教程
2024-08-21 14:16

zhangfeng1133的博客变分推理背景:“指南”程序作为灵活的近似后验概率示例:Pyro中贝叶斯线性回归的平均场变分近似背景:估计和优化证据下限(ELBO)示例:通过随机变分推理的贝叶斯回归(SVI)Pyro中的模型评估背景:贝叶斯模型评估与后验预测...
Python入门
2022-02-16 22:52

气运2020的博客 Python 指定python解释器和编码方式 #!/usr/bin/python # -*- coding: UTF-8 -*- 一、基础语法 1.编码编码：将人类可识别的字符转换为机器可识别的字节码 / 字节序列解码：编码的反向过程叫解码概述：Unicode ...
Python学习笔记1：使用入门
2019-01-20 18:11

ifelif的博客为什么使用Python 软件质量：Python更注重可读性、一致性和软件质量。提高开发者效率：简洁的语法、动态类型、无需编译、内置工具包等特性大大提高开发效率。程序的可移植性：Python程序几乎可以不做任何修改就...
java python混合编程_python+C、C++混合编程
2021-01-12 08:49

Minitab Users Group的博客 TIOBE每个月都会新鲜...有的语言专注于简单高效，比如python，内建的list，dict结构比c/c++易用太多，但同样为了安全、易用，语言也牺牲了部分性能。在有些领域，比如通信，性能很关键，但并不意味这个领域的coder...
Python 网络爬虫与数据采集（一）
2022-01-30 21:28

秃顶的博客 Python 网络爬虫与数据采集第1章序章网络爬虫基础1 爬虫基本概述1.1 爬虫是什么1.2 爬虫可以做什么1.3 爬虫的分类1.4 爬虫的基本流程1.4.1 浏览网页的流程1.4.2 爬虫的基本流程1.5 爬虫与反爬虫1.5.1 爬虫的攻与防...
tmp:tmp
2021-03-14 15:37

3. **清理机制**：操作系统和应用程序通常会有定期清理临时文件的机制，以避免磁盘空间被大量无用的临时文件占用。例如，Windows系统中的磁盘清理工具就包括了清理临时文件的选项。 4. **tmp-main**：这个标签可能...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月30日
展开全部

悬赏问题

¥15 做个有关计算的小程序
¥15 MPI读取tif文件无法正常给各进程分配路径
¥15 如何用MATLAB实现以下三个公式（有相互嵌套）
¥30 关于#算法#的问题：运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题求各位帮我解答一下
¥15 setInterval 页面闪烁，怎么解决
¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化

程序使用了大量的/tmp空间

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新