我脚本里的异步非阻塞每个子进程的CPU占用率都很低怎么办，我想都跑满应该怎么做？

我在学习python异步非阻塞的时候遇到了一些问题，处理数据的时候我在进程池创建了64个进程，运行了大概半个多小时，然后进程CPU使用率变为0了，进程全部休眠，只剩下一两个python3存在CPU占用率，所有操作好像都停下了，需要写入的文件末尾不在新增。这是为什么呢？我应该怎么解决。除此之外，就是每个进程的CPU占用率一直比较低，我怎么才能跑满每一核？

# python
# -*- encoding: utf-8 -*-
'''
@File        :read.py
@Time        :2022/02/10 03:30:02
@Author        :charles kiko
@Version        :1.0
@Contact        :charles_kiko@163.com
@Desc        :扫描基因组内的重复序列 python read.py lens fasta out_file
'''
import os
import gc
import sys
import csv
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
from Bio import SeqIO
import multiprocessing # Step I : 导入模块
from multiprocessing import cpu_count#读取CPU核心数用于匹配线程数

def count_str(seq):
    str_dic = {'A':0,'T':0,'C':0,'G':0}
    for i in seq:
        str_dic[i] = str_dic[i] + 1
    if str_dic['G'] + str_dic['C'] == 0:
        return 0
    else:
        return (str_dic['G'] + str_dic['C']) / len(seq)

def find(seq,name,start,end):
    global DNA_dict# 全局变量
    global contig
    global contigs_0
    global dup
    # print(seq)
    file = open('out.out', 'a+')
    file.write(name+'_'+str(start)+'_'+str(end)+'\n')
    file.close()
    name1 = name+str(start)+str(end)
    GC = count_str(seq)
    for contig_ in contig:
        if contig_ not in DNA_dict.keys():
            print(contig_,'not in keys!')
            gc.collect()
            # continue
            return 0
        top = str(DNA_dict[contig_])
        left = str(seq)
        for i in range(len(top) - len(left) + 1):
            if i + len(left) >= len(top):
                continue
            if top[i:i + len(left)] == left:
                if contig_ == name and start == i:
                    continue
                name2 = contig_+str(i)+str(i+len(left))
                if name1 not in dup:
                    dup.append(name1)
                    lt = [contig_,name1,start,end,len(left),GC,seq]
                    file = open(sys.argv[3], 'a+')
                    file.write('\t'.join([str(m) for m in lt])+'\n')
                if name2 not in dup:
                    dup.append(name2)
                    lt = [contig_,name2,i,i+len(left),len(left),GC,seq]
                    file = open(sys.argv[3], 'a+')
                    file.write('\t'.join([str(m) for m in lt])+'\n')
                # print(seq)
                file = open('out.out', 'a+')
                file.write(contig_+'*'+str(i)+'*'+str(i+len(left))+'\n')
                file.close()
                del lt
                gc.collect()
                file.close()
        del top,left
        gc.collect()
    return 0

if __name__ == '__main__' :#多进程
    length = 5
    dup=[]
    contigs = {}
    contigs_0 = {}
    for i in open(sys.argv[1],'r'):
        if i != '\n':
            lt = i.strip('\n').split()
            contigs[str(lt[0])] = int(lt[1])
    DNA_dict = SeqIO.to_dict(SeqIO.parse(sys.argv[2], "fasta"))# 提取之后直接返回字典
    for key in DNA_dict.keys():
        DNA_dict[key] = str(DNA_dict[key].seq).upper()
    contigs_ = {k: v for k, v in sorted(contigs.items(), key=lambda item: item[1], reverse=True)}
    contig = list(contigs_.keys())
    # print(contig)
    file = open('out.out', 'w')
    file.close()
    file = open(sys.argv[3], 'w')
    file.write(
        '\t'.join(['contig_name','name','start', 'end','seq_length','GC','SEQ'])+'\n')
    file.close()
    pool = multiprocessing.Pool(processes = 8) # Step II : 进程池
    for i in contig:
        if i not in DNA_dict.keys():
            continue
        for j in range(5,len(DNA_dict[i])):
            for m in range(len(DNA_dict[i]) - j + 1):
                contigs_0[str(DNA_dict[i][m:m + j])+str(m)+str(m+j)] = 1
                pool.apply_async(find, (DNA_dict[i][m:m + j],i,m,m+j,), )  # Step III : 异步（并行）计算
    pool.close() # Step IV : 准备结束
    pool.join() # Step IV : 完全结束

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
A Python 萌新花花 2022-02-14 23:42
关注
不跑满是件好事。你的CPU全占满了的话，程序运行会特别慢，而且伤风扇和电脑各个配件的使用寿命

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python网络编程基础(线程与进程、并行与并发、同步与异步、阻塞与非阻塞、CPU密集型与IO密集型)...
2019-01-17 22:25

weixin_34314962的博客 python网络编程基础(线程与进程、并行与并发、同步与异步、阻塞与非阻塞、CPU密集型与IO密集型) 目录线程与进程并行与并发同步与异步阻塞与非阻塞 CPU密集型与IO密集型线程与进程 ...
Iron框架基础教程：基于Rust编程语言的异步网络框架
2023-07-28 00:40

光子AI的博客这些应用程序中的许多都是用Rust语言编写的，所以Rust语言开发的一个重要方向就是提升应用并发性（Concurrency）。Iron是一个基于Rust语言的异步网络框架，它使得编写高效率的网络服务器变得非常简单。本文将详细...
为什么Locust单进程运行模式下只能用到一个处理器的能力?
2022-03-09 15:07

rs勿忘初心的博客 2.进程和线程在多核cpu，多cpu中的运行关系 3.区分并发和并行的区别 4.线程切换 5.计算密集型 vs. IO密集型 6.异步IO 7.分布式进程服务端性能测试工具最核心的部分是压力发生器，而压力发生器的核心要点有...
大学四年，工作2年我总结了后端面试的所有知识点（持续更新）
2020-05-08 11:41

敖丙的博客前言前段时间敖丙不是在复习嘛，很多小伙伴也想要我的复习路线，以及我自己笔记里面的一些知识点，好了，丙丙花了一个月的时间，整整一个月啊，给大家整理出来了。一上来我就放个大招好吧，我的复习脑图，可以...
对不起，学会这些 Linux 知识后，我有点飘
2020-10-10 07:18

程序员cxuan的博客 UNIX 是一个交互式系统，用于同时处理多进程和多用户同时在线。为什么要说 UNIX，那是因为 Linux 是由 UNIX 发展而来的，UNIX 是由程序员设计，它的主要服务对象也是程序员。Linux 继承了 UNIX 的设计目标。从智能...
Linux下C语言开发（多任务编程之任务、进程、线程）
2019-08-28 14:13

翟羽嚄的博客多任务处理是指用户在同一时间内运行多个应用程序，每个应用程序被称做一个任务。Linux就是一个支持多任务的操作系统，它比单任务系统的功能增强了许多。当多任务操作系统使用某种任务调度策略允许两个...
第一章: Vert.x 异步编程的基础知识
2022-05-28 12:44

爱游泳的老白的博客本书这部分的章节将通过使用Vert.x工具包教你异步编程的基本概念。使用Vert.x思考异步操作绝对是可行的(而且很有趣!)，我们将探讨Vert.x应用程序的主要构建块。
linux进程和线程面试题最强集合及参考答案
2024-12-01 17:15

大模型大数据攻城狮的博客进程是什么？进程是计算机中正在运行的程序的实例。它是操作系统进行资源分配和调度的基本单位。从资源角度看，进程拥有独立的内存空间，包括代码段、数据段、堆和栈。代码段存放程序的可执行代码，数据段...
掌握P5级Java面试技巧
2021-03-25 10:37

Java程序员廖志伟的博客 HashMap底层原理，扩容机制，jdk8以后会使用红黑树优化？红黑树和二叉平衡树的区别，...HashMap是Map的一个实现类，它是以键值对存储数据的，Key-Value都是Map.Entry中的属性。当我们向HashMap中存放一个元素(k1,v1)
前端最全面试题
2019-05-04 10:39

吴迪98的博客每个值的特点作用。答案链接同上。 display的属性值有哪些？可以做什么？答案链接同上。哪些CSS属性可以继承？答案链接同上。为什么利用多个域名来存储网站资源会更有效？答案：CDN缓存更方便；突破浏览器并发...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月14日

我脚本里的异步非阻塞每个子进程的CPU占用率都很低怎么办，我想都跑满应该怎么做？

1条回答 默认 最新

问题事件

1条回答默认最新