就是返回完成加工的机器:含义是某机器已经完成所有调度吗?
以及空闲机器选择下一个状态所用的时间吗
是这么理解吗??
这段代码是实现车间调度的强化学习算法,它的目的是返回最先完成加工的机器。首先,它通过np.where函数找到最小mch_time并储存在min_mch_time中,代表最先完成加工的机器。然后,它遍历min_mch_time并找到可以加工的任务,储存在min_mchForJob中。接着,它通过np.intersect1d函数找到闲置机器能选择的task,储存在min_mchFortask中。最后,如果min_mchFortask不为空,则退出循环,否则删除min_mch_time并继续循环。
简单来说,这段代码通过不断找到最先完成加工的机器,并找到空闲机器能选择的task,来实现车间调度的强化学习。