在Python中运用机器学习方法中的回归模型以及随机森林模型对我国旅游业与经济增长之间实证分析的代码,在用回归模型时,运行出来的图不正确,数据运用不完整
1条回答 默认 最新
关注 【相关推荐】
- 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7708258
- 这篇博客你也可以参考下:Python三种方法计算皮尔逊相关系数以及实现给定数据集,返回数据集中每个特征和标签的相关系数
- 您还可以看一下 jeevan老师的Python量化交易,大操手量化投资系列课程之内功修炼篇课程中的 讲师简介,量化交易介绍及自动化交易演示小节, 巩固相关知识点
- 除此之外, 这篇博客: 利用 python 在本地数据集创建训练集和测试集中的 根据自己的数据集,自动划分训练集、测试集 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
举个栗子: 已经分好的文件:
origin 文件夹有三类数据:good,bad,m,每类文件夹包含不同数量的图片,如下:
需要生成数据集的文件:
结果:根据设置好的比例,划分数据集和测试集
完整代码:
import random import os import shutil import glob class get_data_sets(): ''' input_address:输入地址 output_adddress:输出的地址 train_ratio:训练集站比,(0,1) ''' def __init__(self,input_address,output_adddress, train_ratio): self.__input_address = input_address self.__output_address = output_address self.__train_ratio = train_ratio def run(self): #获取数据种类 class_address_list = glob.glob(self.__input_address + '\*') class_name_list = [ class_address.split('\\')[-1] for class_address in class_address_list ] #print print('数据分类为 {} \n训练集占比 {}'.format((class_name_list), self.__train_ratio)) #新建训练、测试文件夹 train_address = self.__output_address + '/train' test_address = self.__output_address + '/test' os.mkdir(train_address) os.mkdir(test_address) #在训练、测试文件夹 新建 类型 文件 for class_name in class_name_list: os.mkdir(train_address + '/{}'.format(class_name)) os.mkdir(test_address + '/{}'.format(class_name)) #获取训练、测试数据 class_num = [ len(os.listdir(all_class_address)) for all_class_address in class_address_list ] # 获取每类数据长度 random.seed(2) #设置种子,保证每次分类一致 train_address_list = [train_address + '/{}'.format(class_name) for class_name in class_name_list] test_address_list = [test_address + '/{}'.format(class_name) for class_name in class_name_list] #复制文件 for i,num in enumerate(class_num): all_index = set(range(num)) train_index = random.sample(all_index,int(self.__train_ratio*num)) test_index = all_index - set(train_index) data_list = glob.glob(class_address_list[i] + '\*') for _ in train_index: shutil.copy(data_list[_], train_address_list[i]) for _ in test_index: shutil.copy(data_list[_], test_address_list[i] ) print('创建完成')
运行代码:
input_address = r"D:\A_test\csdn_test\data_sets\origin" output_address = "D:\A_test\csdn_test\data_sets\data" a = get_data_sets(input_address,output_address,0.6) a.run()
如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^解决 无用评论 打赏 举报
悬赏问题
- ¥15 phython如何实现以下功能?查找同一用户名的消费金额合并—
- ¥15 孟德尔随机化怎样画共定位分析图
- ¥18 模拟电路问题解答有偿速度
- ¥15 CST仿真别人的模型结果仿真结果S参数完全不对
- ¥15 误删注册表文件致win10无法开启
- ¥15 请问在阿里云服务器中怎么利用数据库制作网站
- ¥60 ESP32怎么烧录自启动程序
- ¥50 html2canvas超出滚动条不显示
- ¥15 java业务性能问题求解(sql,业务设计相关)
- ¥15 52810 尾椎c三个a 写蓝牙地址