python死循环的退出条件


import os
import pickle

import numpy as np
import torch

from net.config import LinXiaoNetConfig
from net import LinXiaoNet
from net.loss.alpha_loss import AlphaLoss
from net.data.train_data_cache import TrainDataCache
from mcts.monte_tree_v2 import MonteTree, transfer_to_net_input, pos_idx2pos_pair
from utils.log import init_logger, logger


def save_chess_record(file_path, record):
    if not os.path.isdir(os.path.dirname(file_path)):
        os.makedirs(os.path.dirname(file_path))
    with open(file_path, 'wb+') as f:
        pickle.dump(record, f)


def save_checkpoint(save_dir, ep_num, chess_num, model_dict, optimizer_dict, lr_schedule_dict, data_cache):
    if not os.path.isdir(save_dir):
        os.makedirs(save_dir)
    torch.save(ddel_dict, os.path.join(save_dir, 'model.pth'))
    torch.save(optimizer_dict, os.path.join(save_dir, 'optimizer.pth'))
    torch.save(lr_schedule_dict, os.path.join(save_dir, 'lr_schedule.pth'))
    with open(os.path.join(save_dir, 'epoch.txt'), 'w+') as f:
        f.write('{}\n'.format(ep_num))
    with open(os.path.join(save_dir, 'chess_num.txt'), 'w+') as f:
        f.write('{}\n'.format(chess_num))
    with open(os.path.join(save_dir, 'data_cache.pkl'), 'wb+') as f:
        pickle.dump(data_cache, f)
    # with open(os.path.join(save_dir, 'tree.pkl'), 'wb+') as f:
    #     pickle.dump(tree, f)


def load_checkpoint(checkpoint_path):
    filename_list = os.listdir(checkpoint_path)
    model_filename = None
    optimizer_filename = None
    lr_schedule_filename = None
    epoch_filename = None
    chess_num_filename = None
    data_cache_filename = None
    # tree_filename = None

    model_data = None
    optimizer_data = None
    lr_schedule_data = None
    epoch_data = None
    chess_num = None
    data_cache_data = None
    # tree_data = None

    for filename in filename_list:
        if filename.find('model') > -1:
            model_filename = filename
        if filename.find('optimizer') > -1:
            optimizer_filename = filename
        if filename.find('lr_schedule') > -1:
            lr_schedule_filename = filename
        if filename.find('epoch') > -1:
            epoch_filename = filename
        if filename.find('chess_num') > -1:
            chess_num_filename = filename
        if filename.find('data_cache') > -1:
            data_cache_filename = filename
        # if filename.find('tree') > -1:
        #     tree_filename = filename
    if model_filename is not None:
        model_data = torch.load(os.path.join(checkpoint_path, model_filename))
    if optimizer_filename is not None:
        optimizer_data = torch.load(os.path.join(checkpoint_path, optimizer_filename))
    if lr_schedule_filename is not None:
        lr_schedule_data = torch.load(os.path.join(checkpoint_path, lr_schedule_filename))
    if epoch_filename is not None:
        with open(os.path.join(checkpoint_path, epoch_filename), 'r') as f:
            epoch_data = int(f.readlines()[0].strip())
    if chess_num_filename is not None:
        with open(os.path.join(checkpoint_path, chess_num_filename), 'r') as f:
            chess_num = int(f.readlines()[0].strip())
    if data_cache_filename is not None:
        with open(os.path.join(checkpoint_path, data_cache_filename), 'rb') as f:
            data_cache_data = pickle.load(f)
    # if tree_filename is not None:
    #     with open(os.path.join(checkpoint_path, tree_filename), 'rb') as f:
    #         tree_data = pickle.load(f)
    return model_data, optimizer_data, lr_schedule_data, data_cache_data, epoch_data, chess_num


# 生成训练数据
def generate_train_data(chess_size, chess_record):
    # 新建个空棋盘状态
    chess_state = np.zeros((chess_size, chess_size))
    data = []
    # 初始是黑子落子
    player = 1
    # 根据对弈记录步数计算是谁赢了
    winner = -1 if len(chess_record) % 2 == 0 else 1
    for i in range(len(chess_record)):
        # 获取落子位置索引
        pos_idx = chess_record[i][1]
        state = transfer_to_net_input(chess_state, player, chess_size)
        # 记录训练数据
        data.append({
            'state': state,
            'distribution': chess_record[i][0],
            'value': winner
        })
        # 根据棋盘状态和落子位置更新棋盘状态
        chess_state[pos_idx2pos_pair(pos_idx, chess_size)[0], pos_idx2pos_pair(pos_idx, chess_size)[1]] = player
        # 易手
        player = -player
        # TODO: 思考这里为什么要变号
        # 因为winner是训练数据中的奖励value，应该始终保持对于赢家为1、对于输家为-1；加入黑棋应，winner初始值为1
        # 由于黑子先手，因此对于所有黑子落子的状态都给正奖励，给所有白子落子的状态都给负奖励；反之亦然
        winner = -winner
    return data


if __name__ == '__main__':

    conf = LinXiaoNetConfig()
    conf.set_cuda(True)
    conf.set_input_shape(8, 8)
    conf.set_train_info(5, 16, 1e-2)
    conf.set_checkpoint_config(5, 'checkpoints/v2train')
    conf.set_num_worker(0)
    conf.set_log('log/v2train.log')
    # conf.set_pretrained_path('checkpoints/v2m4000/epoch_15')

    init_logger(conf.log_file)
    logger()(conf)

    device = 'cuda' if conf.use_cuda else 'cpu'

    # 创建策略网络
    model = LinXiaoNet(3)
    model.to(device)

    loss_func = AlphaLoss()
    loss_func.to(device)

    optimizer = torch.optim.SGD(model.parameters(), conf.init_lr, 0.9, weight_decay=5e-4)
    lr_schedule = torch.optim.lr_scheduler.StepLR(optimizer, 1, 0.95)

    # initial config tree
    tree = MonteTree(model, device, chess_size=conf.input_shape[0], simulate_count=500)
    data_cache = TrainDataCache(num_worker=conf.num_worker)

    ep_num = 0
    chess_num = 0
    # config train interval
    train_every_chess = 18

    # 加载检查点
    if conf.pretrain_path is not None:
        model_data, optimizer_data, lr_schedule_data, data_cache, ep_num, chess_num = load_checkpoint(conf.pretrain_path)
        model.load_state_dict(model_data)
        optimizer.load_state_dict(optimizer_data)
        lr_schedule.load_state_dict(lr_schedule_data)
        logger()('successfully load pretrained : {}'.format(conf.pretrain_path))

    while True:
        logger()(f'self chess game no.{chess_num+1} start.')
        # 进行一次自我对弈，获取对弈记录
        chess_record = tree.self_game()
        logger()(f'self chess game no.{chess_num+1} end.')
        # 根据对弈记录生成训练数据
        train_data = generate_train_data(tree.chess_size, chess_record)
        # 将训练数据存入缓存
        for i in range(len(train_data)):
            data_cache.push(train_data[i])
        if chess_num % train_every_chess == 0:
            logger()(f'train start.')
            loader = data_cache.get_loader(conf.batch_size)
            model.train()

            for _ in range(conf.epoch_num):
                loss_record = []
                for bat_state, bat_dist, bat_winner in loader:
                    bat_state, bat_dist, bat_winner = bat_state.to(device), bat_dist.to(device), bat_winner.to(device)
                    optimizer.zero_grad()
                    prob, value = model(bat_state)
                    loss = loss_func(prob, value, bat_dist, bat_winner)
                    loss.backward()
                    optimizer.step()
                    loss_record.append(loss.item())
                logger()(f'train epoch {ep_num} loss: {sum(loss_record) / float(len(loss_record))}')
                ep_num += 1
                if ep_num % conf.checkpoint_save_every_num == 0:
                    save_checkpoint(
                        os.path.join(conf.checkpoint_save_dir, f'epoch_{ep_num}'),
                        ep_num, chess_num, model.state_dict(), optimizer.state_dict(), lr_schedule.state_dict(), data_cache
                    )
            lr_schedule.step()
            logger()(f'train end.')
        chess_num += 1
        save_chess_record(
            os.path.join(conf.checkpoint_save_dir, f'chess_record_{chess_num}.pkl'),
            chess_record
        )
        # break

    pass

这个python运行，最后这个循环有退出条件吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-14 22:42
关注
引自免费微信小程序：皆我百晓生

这个Python程序中的主循环没有显式的退出条件。它会持续不断地进行自我对弈（self-game），生成训练数据，将数据添加到缓存，并在达到一定数量的棋局后进行训练。循环的执行依赖于程序未被人为中断。

要给这个无限循环添加一个退出条件，你可以考虑以下方法之一：

设置最大棋局数：定义一个最大棋局数变量，当chess_num达到这个值时，跳出循环。

max_chess_num = 10000 # 设置最大的棋局数 while chess_num < max_chess_num: ...

键盘中断（KeyboardInterrupt）：允许用户通过按下Ctrl+C来中断程序执行。在这种情况下，你需要捕获KeyboardInterrupt异常并适当地清理资源。

try: while True: ... except KeyboardInterrupt: print("Training interrupted by user.") # 在这里添加必要的清理操作，例如保存当前状态等 exit(0)

根据特定条件退出：你还可以基于其他逻辑条件，比如训练效果达到某个阈值或者达到预设的训练轮数等，来决定何时退出循环。

选择上述任一方式，并相应地修改代码即可为循环添加退出条件。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python编程语言中:f的含义 python 开发语言
2021-11-05 17:43

回答 3 已采纳 f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符.具体函数可以参考看
利用for循环进行python编程 python
2021-11-23 18:45

回答 1 已采纳 for i in range(1,5): for j in range(0,4 - i): print(end =" "); for k in range(0,2*
Python编程语言 list python 有问必答
2021-12-29 11:00

回答 2 已采纳 import random n=int(input()) list=[] for i in range(n): list.append(random.randint(1,200)) print
python死循环_python中死循环
2020-11-24 00:16

weixin_39631572的博客死循环当一个循环可以执行无限次，也就是没有终止条件，我们称这个循环是死循环。编写死循环程序实际上是不对的，一旦写出来一个程序运行后发现是死循环，一定要立即终止程序的运行！用python实现一个...
Python如何在达成指定条件时重新执行本次循环？ python
2023-03-18 23:03

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ您可以在循环体中添加一个判断，判断用户输入的是否是 "y"，如果是，则直接跳到循环开始重新执行本次循环。示例代码如下： while True: # 输入学生成绩并计
python小白有关退出while循环的提问 python
2020-03-14 09:17

回答 3 已采纳你循环里的lower没打括号，嗯我也是小白 command=input("> ").lower() while command!="quit": if command=="star
Python 中for循环如何不换行 python
2022-04-03 09:50

回答 2 已采纳 favorite_languages={ 'Mike':['Java',20], 'Tracy':['C++',21], 'Jack':['Python',19], } for name,lang
python死循环_Python 死循环和嵌套循环
2020-11-20 21:14

weixin_39607450的博客何为死循环：在编程中，一个无法靠自身的控制终止的循环被称为死循环。死循环的使用：死循环并非一无是处，C语言中死循环while true或 while 1 是单片机编程的普遍用法，死循环一直运行等待中断程序发生，然后去处理...
python编程解决问题 python 有问必答
2021-06-09 20:56

回答 2 已采纳 import random a=[] sum=0 max=0 min=1000 for i in range(20): a.append(random.randint(1,999))
请问python如何统计循环次数 python
2021-08-10 18:13

回答 2 已采纳很好奇你的代码是怎么跑起来的，你试一试我的我设置了跑10000000000000.0次后自动停止，有用的话点一下采纳
用Python编程佩尔数列pell数列循环结构 python
2021-10-28 20:17

回答 1 已采纳可以使用递归的方法写一个pell函数，看起来很简洁，但效率很低，因为是非线性递归，大概连pell(50)都算不出来（千万不要尝试）。 >>> def pell(n): if
python死循环用什么好弄_用python死循环
2020-11-30 04:09

weixin_39595164的博客死循环当一个循环可以执行无限次，也就是没有终止条件，我们称这个循环是死循环。编写死循环程序实际上是不对的，一旦写出来一个程序运行后发现是死循环，一定要立即终止程序的运行！用python实现一个...
python要怎么在for循环中条件符合才会继续循环否则重新开始这一次循环？ python
2021-03-27 19:51

回答 2 已采纳加个while(true)不就行了，成功就跳过此次，不成功一直重新本次
Python基础之遍历循环、条件循环、嵌套循环
2022-06-11 16:30

小牛牛编程的博客 Python基础之遍历循环（for ...in....）、条件循环while、嵌套循环
linux python 死循环语句,讲解Linux平台中的Python while循环
2021-05-16 05:00

李凤台的博客循环是编程语言的基本概念之一，当您要重复特定代码块多次直到满足给定条件时，循环很方便。Python中有两个基本的循环构造，for和while循环。本教程介绍了Python中while循环的基础，我们还将向您展示如何使用else...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月14日

悬赏问题

¥15 ad5933的I2C
¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗？
¥15 数学建模求思路及代码
¥50 silvaco GaN HEMT有栅极场板的击穿电压仿真问题
¥15 谁会P4语言啊，我想请教一下
¥15 哪个tomcat中startup一直一闪而过找不出问题
¥15 这个怎么改成直流激励源给加热电阻提供5a电流呀
¥50 求解vmware的网络模式问题别拿AI回答
¥24 EFS加密后，在同一台电脑解密出错，证书界面找不到对应指纹的证书，未备份证书，求在原电脑解密的方法，可行即采纳
¥15 springboot 3.0 实现Security 6.x版本集成

python死循环的退出条件

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新