用MATLAB对鸢尾花数据分类

在MATLAB中，应用软间隔SVM算法（非线性）对鸢尾花数据进行分类，并画图

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2022-11-11 12:04

关注

看下这篇博客，也许你就懂了，链接：支持向量机实现鸢尾花数据集分类matlab
除此之外, 这篇博客: 支持向量机实现鸢尾花数据集分类matlab中的代码部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

%% 数据预处理和导入
close;clear;clc
[train_data,train_label,test_data,test_label,m1,n1,m2,n2] = data_set(0.6,100);
%% 模型训练
Kernel = 'linear';% Kernel 核技巧备选：gaussian linear sigmoid mullinear 
svm = train_svm(train_data',train_label',Kernel,10); % svm = train_svm(X,Y,kertype,C) C为变量上界（惩罚因子） svm为结构体
%% 模型测试
result = test_svm(svm,test_data',test_label',Kernel);
fprintf('训练完成！\n应用模型：SVM 支持向量机\n优化算法:interior-point-convex\n核函数：%s\n测试集识别率为：%f\n',Kernel,result.accuracy);
%% 作图显示数据以及训练结果；中间为支持向量[三维]
draw_svm(train_data,train_label,svm,3,Kernel);

function [train_data,train_label,test_data,test_label,m1,n1,m2,n2] = data_set(k,data_num)
% 功能说明：完成数据的预处理，setosa：1  versicolor：2  virginica：3
% 调用语法及参数说明：[data_iris,data_label] = data_set();
% 
load('data_iris.mat');load('data_label.mat');
data_label = zeros(data_num,1);
for i = 1:data_num
    switch species(i)
        case 'setosa'
            data_label(i) = 1;
        case 'versicolor'
            data_label(i) = -1;
%         case 'virginica'
%             data_label(i) = 3;
    end
end
data_iris = iris(1:data_num,:);

% 乱序排列
randIndex = randperm(data_num);
data_new=data_iris(randIndex,:);
label_new=data_label(randIndex,:);

% 分为两组，比例k用于训练，剩余用于测试
k = k*data_num;
train_data=data_new(1:k,:);
train_label=label_new(1:k,:);
test_data=data_new(k+1:end,:);
test_label=label_new(k+1:end,:);
[m1,n1] = size(train_data);
[m2,n2] = size(test_data);
end

function draw_svm(train_data,train_label,svm,data_features,Kernel)
% 功能说明：根据数据特征的维数判断，进而分别绘图
% 函数语法及参数列表：draw_svm(inputArg1,data_features)
% input: 
% train_data: 训练数据集 
% train_label：训练集数据的类别
% svm：svm结构体(详见train_svm，help train_svm)
% data_features特征维数

switch data_features
    case 2
        plot(train_data(train_label==1,1),train_data(train_label==1,2),'ro',train_data(train_label==-1,1),train_data(train_label==-1,2),'go');hold on;
        plot(svm.data(1,:),svm.data(2,:),'mo');hold on;title(['样本分布',Kernel]); % 显示支持向量 'mo'品红色的圈
        [x1,x2] = meshgrid(4:0.01:7,2:0.01:5);
        [rows,cols] = size(x1);  
        nt = rows*cols;                  
        Xt = [reshape(x1,1,nt);reshape(x2,1,nt)];
        Yt = ones(1,nt);
        result = test_svm(svm, Xt, Yt,Kernel);
        Yd = reshape(result.Y,rows,cols);
        contour(x1,x2,Yd,'m');
    otherwise
        plot3(train_data(train_label==1,1),train_data(train_label==1,2),train_data(train_label==1,3),'r.');hold on;
        plot3(train_data(train_label==-1,1),train_data(train_label==-1,2),train_data(train_label==-1,3),'gx');hold on;
        plot3(svm.data(1,:),svm.data(2,:),svm.data(3,:),'mo');hold on;
        
        title(['样本分布',Kernel]);
end
end

function K = kernel(X,Y,kerneltype)
% 功能：支持多种核运算;
% 语法结构：K = kernel(X,Y,kerneltype)，kerneltype选择核技巧
% 'linear'：线性内积
%           K(v1,v2) = <v1,v2>
% 'gaussian'：高斯核 %
%           K(v1,v2)=exp(-gama||v1-v2||^2)
% 'sigmoid':sigmoid核；双曲正切函数
%           K(v1,v2)=tanh(gama<v1,v2>+c)    
% 'mullinear':多项式核
%           K（v1,v2）=<v1,v2>^d;d为多项式的次数
% 'triangle':三角核
%           K（v1,v2）=-||v1-v2||^d

% 在svm中运用线性，高斯或者sigmoid效果比较好
switch kerneltype
    case 'linear' % 线性内积
        K = X'*Y;
    case 'sigmoid'
        belta = 0.01;
        theta = 0.001;
        K = tanh(belta*X*Y+theta);
    case 'gaussian'% k(v1,v2) = exp(-||v1-v2||^2/(2sigma^2))
        delta = 2*1.414;
        delta = delta*delta;
        XX = sum(X'.*X',2);
        YY = sum(Y'.*Y',2);
        XY = X'*Y;
        K = abs(repmat(XX,[1 size(YY,1)]) + repmat(YY',[size(XX,1) 1]) - 2*XY);
        K = exp(-K./delta);
    case 'mullinear'
        K = (X'*Y).^2;
%     case'triangle'
%         K = -norm(X-Y,1)^2;
        
end
end

function result = test_svm(svm, test_data, test_label, kerneltype)
% 功能说明：
% 完成测试集的预测以及准确率的输出
% 语法习惯核参数列表：result = test(svm, test_data, test_label, kerneltype)
% input:
% svm: train_svm函数返回的结构体（详见help train_svm）
% test_data: 测试数据
% test_label：测试集标签
% kerneltype：核技巧种类，形式参数，可选：linear gaussian sigmoid mullinear triangle
% output:
% result：结构体，属性如下
% result.Y:测试集中数据的预测类别  result.Y ∈{+1，-1}
% result.accuracy:测试集的准确率

% 教材非线性支持向量机学习算法的策略为选择a的一个正分量0< a <C进行计算
% 此处选择了对所有满足0< ai <C求得bi，并对b进行取平均运算
sum_b = svm.label - (svm.a'.* svm.label)*kernel(svm.data,svm.data,kerneltype);
b = mean(sum_b);
w = (svm.a'.* svm.label)*kernel(svm.data,test_data,kerneltype);% 统一起见，令 w = sigma(ai*yi*K(x,xi)
result.Y = sign(w+b);% 加外壳符号函数进行分类
result.plotx = min(test_data(1,:)):0.001: max(test_data(1,:));

result.accuracy = size(find(result.Y==test_label))/size(test_label);% 预测正确的数据数目/总测试集数目
end

function svm = train_svm(train_data,train_label,kertype,C)
% 功能说明：完成SVM训练
% 语法习惯与参数列表：svm = train_svm(train_data,train_label,kertype,B)
% input:
% train_data:训练数据
% train_label：训练数据的类别
% kertype：核函数的类别
% C 惩罚参数
% B 为变量约束中的上界
% output:
% svm：是一个结构体，包含属性如下：
% svm.a :得到的凸二次规划的解
% svm.data ： 支持向量
% svm.label ：支持向量的类别
% ------------*************************···········
% ------------关键函数quadprog的一些说明···········
% 函数quadprog：用于解二次规划问题
% 问题描述：
% min（x）: 0.5·x'·H·x + f'·x
%      
%           A·x <= b,    
% s.t.:   Aeq·x  = beq;
%         lb <=x <= ub;
% 
% 全参数语法结构：x = quadprog(H,f,A,b,Aeq,beq,lb,ub,x0,options);
% 变量说明：
% H,A,Qeq是矩阵，f,b,beq,lb,ub,x是向量
% options:选择优化算法并进行设置
% 优化选项设置，对属性进行设置：
% 使用 optimoptions 或 optimset 创建选项(属性)；
% 指定为 optimoptions 的输出或 optimset 等返回的结构体。

% 变量初始化以及超参设置
n = length(train_label); % 对变量的自由约束，上下界
H = (train_label'*train_label).*kernel(train_data,train_data,kertype);% H为yi*yj*K(xi,xj)
f = -ones(n,1); % 保证f为列向量，原式中包含转置操作
A = [];% 不含不等约束
b = [];% 不含不等约束
Aeq = train_label;  % s.t.: aY = 0;
beq = 0;            % s.t.: aY = 0;
lb = zeros(n,1);    % 解：a 的范围  
ub = C*ones(n,1);   % 0 <= a <= C
a0 = zeros(n,1);    % a0是解的初始近似值
options = optimset;  % 'interior-point-convex'（默认优化算法）
options.Display = 'iter-detailed';% 显示优化步骤

% x = quadprog(H,f,A,b,Aeq,beq,lb,ub,x0,options) 使用 options 中指定的优化选项求解上述问题。
% 使用 optimset 创建 options。如果不提供初始点，设置 x0 = []。
a = quadprog(H,f,A,b,Aeq,beq,lb,ub,a0,options);

% 寻找支持向量；a>e 则认为train_data为支持向量 函数find查找逻辑为真的索引  
e = 1e-4;      

sv_index = find(abs(a)>e);
svm.a = a(sv_index);
svm.data = train_data(:,sv_index);% 作图显示支持向量位置
svm.label = train_label(sv_index);
end

报告相同问题？

关注问题

如何用matlab对一组数据进行定积分计算 matlab
2021-10-01 13:59

回答 1 已采纳你好，trapz要搞清楚你积分的维度在哪个方向，比如对V = T^2+X^2在x方向积分(即积分消去x留下对t的函数) t = 0:1:10; x = 0:1:20; [T, X] = meshgri
运用matlab对Excel数据进行处理 matlab
2023-03-09 23:09

回答 6 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ您可以使用MATLAB的"readtable"函数将Excel表格读取到MATLAB中，然后使用MATLAB的函数和语法来处理表格数据。以下是一个例子，假设您有一个Exc
用MATLAB对一组磁滞曲线数据进行拟合 matlab 有问必答
2021-11-16 16:55

回答 1 已采纳你好，你给出的代码是拉格朗日（Lagrange）插值的代码，不是拟合的代码，拟合建议用polyfit函数，因为你如果用拉格朗日多项式插值的话，虽然可以保证多项式经过每一个点，但是当插值点个数过多的话，
MATLAB: 神经网络预测鸢尾花的分类
2022-03-19 10:35

首先，鸢尾花数据集是一个经典的多类分类问题，源于生物学家弗朗西斯·费雪的研究。这个数据集包含了三种鸢尾花（Setosa、Versicolour和Virginica）的不同特征，如花瓣长度、花瓣宽度、萼片长度和萼片宽度。我们的...
用matlab提取Excel里的特定数据并求均值方差 matlab
2021-09-10 17:04

回答 1 已采纳 data=readmatrix('test.xlsx','Range','A1:A30'); % 均值 mu=mean(data) % 方差 sd2=var(data)
matlab 如何用削波对数据进行归一化？ matlab 有问必答
2021-10-17 10:49

回答 1 已采纳同学，matlab归一化函数不止mapminmax呢，还有诸如mapstd（均值为0方差为1），你可以试一试，这个其实也非常常用，用法跟mapminmax是一致的。比如 [Y,PS] = mapstd
请问怎么在MATLAB对现有数据进行双曲正割拟合？ matlab 有问必答
2022-03-10 13:38

回答 2 已采纳比方说你有两列数据储存在变量xy中，那么可以这么做 % 双曲正割函数拟合 % y = a*sech(b*(x+c))+d; % 这是原始数据【两列】 xy = [ 15.0375939849624
人工智能Matlab鸢尾花分类器+归一化+输入excel数据计算分类器准确率+150个鸢尾花数据
2020-12-30 12:01

鸢尾花数据集是机器学习领域经典的多类别分类问题，它包含了三种鸢尾花品种：山鸢尾（Iris setosa）、变色鸢尾（Iris versicolor）和弗吉尼亚鸢尾（Iris virginica）。每个样本有四个特征：花瓣长度、花瓣宽度、花萼...
matlab：读取文件的数据类型 matlab 有问必答
2022-04-09 02:13

回答 2 已采纳 fread(fileID,sizeA,precision) 将文件数据读取到维度为 sizeA 的数组 A 中，并将文件指针定位到最后读取的值之后。fread 按列顺序填充 A。根据 precisio
用matlab批量读取处理数据文件 matlab
2021-11-22 15:04

回答 1 已采纳你好,格式大致如下 for i = 0:2000 filename = sprintf('m%06d.ovf',i); % 这里按照文件名filename读取ovf end
matlab中double数据类型 carbon matlab
2023-04-14 11:25

回答 2 已采纳该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：在 Matlab 中，当您执行运算时，如果数组的大小不兼容，则会出现错误。在您的代码中，错误提示指出“数组的大小不兼容”，这意味着您
MATLAB 人工智能实验设计基于BP神经网络的鸢尾花分类器设计
2022-05-15 21:28

总结，本实验通过MATLAB的BP神经网络，利用鸢尾花数据集进行分类器设计，旨在让学生理解分类问题的处理流程，掌握神经网络模型的构建、训练和评估。通过实践，学生能够更好地理解和应用深度学习和机器学习的概念。
Matlab 初学者求解答，如何用Matlab进行大型数据提取 matlab
2023-01-03 11:17

回答 1 已采纳参考代码如下： % 定义压缩文件的路径 zip_file_path = '/path/to/zip/file.zip'; % 解压缩文件 unzip(zip_file_path, '/path/to
matlab RBF神经网络对iris鸢尾花数据集进行分类
2022-10-20 21:40

studyer_domi的博客 RBF网络能够逼近任意的非线性函数，可以处理系统内的难以解析的规律性，具有良好的泛化能力，并有很快的学习收敛速度，已成功应用于非线性函数逼近、时间序列分析、数据分类、模式识别、信息处理、图像处理、系统...
鸢尾花数据集（iris.txt）
2023-04-02 15:27

该数据集为人工智能大数据等常用数据集，也是MATLAB常用的分类实验数据集，由著名的科学家Fisher收集整理，该数据集包含150个数据集，分为3类，每类50个数据，每个数据包含四个属性。四个属性： Sepal.Length...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月11日

悬赏问题

¥15 问题遇到的现象和发生背景 360导航页面千次ip是20元，但是我们是刷量的超过100ip就不算量了，假量超过100就不算了这是什么逻辑呢有没有人能懂的 1000元红包感谢费
¥30 计算机硬件实验报告寻代
¥15 51单片机写代码，要求是图片上的要求，请大家积极参与，设计一个时钟，时间从12:00开始计时，液晶屏第一行显示time，第二行显示时间
¥15 用C语言判断命题逻辑关系
¥15 原子操作+O3编译，程序挂住
¥15 使用STM32F103C6微控制器设计两个从0到F计数的一位数计数器（数字），同时，有一个控制按钮，可以选择哪个计数器工作：需要两个七段显示器和一个按钮。
¥15 在yolo1到yolo11网络模型中，具体有哪些模型可以用作图像分类？
¥15 AD9910输出波形向上偏移，波谷不为0V
¥15 淘宝自动下单XPath自动点击插件无法点击特定<span>元素，如何解决？
¥15 曙光1620-g30服务器安装硬盘后看不到硬盘

用MATLAB对鸢尾花数据分类

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新