深度聚类网络模型代码优化

题目描述：50k张图片作为训练集，提供10k张图片作为测试集，提供5.4k个约束条件（非冗余条件共4k个），以csv格式文件存储。该文件每行共3个数（记为i， j， l），用逗号分割，表示训练集id为i和id为j的图片的关系为l。l的取值为1表示同簇，l的取值为-1表示异簇。形如:1,2,1
2,4,-1
目前问题：效果低，Loss始终为负数。请有人提建议，帮修改。

#最终版
import os
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms
from PIL import Image

# 定义数据集类
class ImageDataset(Dataset):
    def __init__(self, data_folder, transform=None):
        self.data_folder = data_folder
        self.image_paths = os.listdir(data_folder)
        self.transform = transform
    
    def __len__(self):
        return len(self.image_paths)
    
    def __getitem__(self, idx):
        img_name = os.path.join(self.data_folder, self.image_paths[idx])
        img = Image.open(img_name).convert("RGB")
        
        if self.transform:
            img = self.transform(img)
        
        return img

# 定义编码器
class Encoder(nn.Module):
    def __init__(self):
        super(Encoder, self).__init__()
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1),
            nn.ReLU(True),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1),
            nn.ReLU(True),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )
        
    def forward(self, x):
        x = self.encoder(x)
        return x

# 定义聚类层
class ClusteringLayer(nn.Module):
    def __init__(self, input_dim, num_clusters):
        super(ClusteringLayer, self).__init__()
        self.num_clusters = num_clusters
        self.weights = nn.Parameter(torch.Tensor(num_clusters, input_dim))
        self.reset_parameters()
    
    def reset_parameters(self):
        nn.init.xavier_uniform_(self.weights)
    
    def forward(self, x):
        # Reshape x to (batch_size, input_dim)
        x_reshaped = x.view(x.size(0), -1)
        
        # Expand weights to match batch size
        expanded_weights = self.weights.unsqueeze(0).expand(x.size(0), -1, -1)
        
        # Compute the distance between x and weights
        distances = torch.sum(torch.pow(x_reshaped.unsqueeze(1) - expanded_weights, 2), dim=2)
        
        # Compute q
        q = 1.0 / (1.0 + distances)
        q = q.pow((1 + 1) / 2)
        q = (q.t() / torch.sum(q, dim=1)).t()
        return q


# 定义深度聚类网络
class DeepClusteringNet(nn.Module):
    def __init__(self, num_clusters):
        super(DeepClusteringNet, self).__init__()
        self.encoder = Encoder()
        self.clustering_layer = ClusteringLayer(32 * 8 * 8, num_clusters)
    
    def forward(self, x):
        x = self.encoder(x)
        x = x.view(x.size(0), -1)
        self.encoder_output_dim = x.size(1)  # 计算编码器输出维度
        q = self.clustering_layer(x)
        return q

# 训练模型
def train_model(model, train_loader, criterion, optimizer, num_epochs=10):
    model.train()
    for epoch in range(num_epochs):
        running_loss = 0.0
        for inputs in train_loader:
            inputs = inputs.to(device)
            
            optimizer.zero_grad()
            outputs = model(inputs)
            target = torch.ones_like(outputs) / outputs.size(1)  # 构建均匀分布作为目标
            loss = criterion(outputs, target)  # 使用KL散度作为损失函数
            loss.backward()
            optimizer.step()
            
            running_loss += loss.item() * inputs.size(0)
        
        epoch_loss = running_loss / len(train_loader.dataset)
        print(f"Epoch {epoch+1}/{num_epochs}, Loss: {epoch_loss:.4f}")

# 对测试集进行聚类
def cluster_test_set(model, test_loader):
    model.eval()
    predictions = []
    with torch.no_grad():
        for inputs in test_loader:
            inputs = inputs.to(device)
            outputs = model(inputs)
            _, pred = torch.max(outputs, 1)
            predictions.extend(pred.cpu().numpy())
    return predictions

# 加载数据
train_data_folder = "C:\\Users\\marryhan\\Desktop\\image_train"
test_data_folder = "C:\\Users\\marryhan\\Desktop\\image_test"
query_file = "C:\\Users\\marryhan\\Desktop\\query.csv"

train_dataset = ImageDataset(train_data_folder, transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
]))
test_dataset = ImageDataset(test_data_folder, transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
]))

# 设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 创建数据加载器
batch_size = 64
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

# 建立模型
num_clusters = 4
model = DeepClusteringNet(num_clusters).to(device)

# 定义损失函数和优化器
criterion = nn.KLDivLoss(reduction='batchmean')  # 修改为'batchmean'
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
train_model(model, train_loader, criterion, optimizer, num_epochs=10)

# 对测试集进行聚类
test_predictions = cluster_test_set(model, test_loader)

# 保存结果到CSV文件
results = pd.DataFrame({'ID': range(len(test_predictions)), 'Class': test_predictions})
results.to_csv('test_results.csv', index=False)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-06-07 20:43
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

从您提供的代码和描述来看，您正在使用深度学习进行图像聚类，并且遇到了损失值始终为负数的问题。这通常意味着模型的输出分布与目标分布之间的差异过大，或者损失函数的使用方式可能存在问题。以下是一些建议，希望能帮助您优化模型：

检查数据预处理：确保图像数据被正确地预处理和标准化，这对于模型的性能至关重要。

调整损失函数：您当前使用的是KL散度作为损失函数，但是KL散度通常用于衡量两个概率分布之间的差异。在聚类任务中，可能需要对损失函数进行调整，例如使用基于对比学习的损失函数，或者调整KL散度的计算方式。

优化聚类层：在ClusteringLayer中，您计算了距离并应用了非线性变换来得到q，但是q的计算可能需要根据实际情况进行调整。您可以尝试不同的距离度量或非线性变换方法。

初始化参数：检查模型参数的初始化方式，不恰当的初始化可能导致模型训练困难。

调整学习率和优化器：尝试使用不同的学习率或优化器，比如SGD或RMSprop，以及它们的不同参数设置。

使用预训练模型：如果可能的话，使用预训练的模型作为编码器的起点，这可以帮助模型更快地收敛。

正则化：考虑添加正则化项（如L2正则化）到损失函数中，以防止模型过拟合。

超参数调整：进行超参数调整，包括学习率、批量大小、优化器参数等。

模型评估：使用不同的评估指标来衡量聚类效果，如轮廓系数（Silhouette Coefficient）或Davies-Bouldin指数。

代码审查：审查代码以确保没有逻辑错误或实现错误。

关于参考资料，您可以参考以下几篇文章，它们提供了深度聚类和损失函数相关的深入讨论：

[深度聚类-CSDN博客][^3^]：介绍了深度聚类的概念和现有算法的总结。
[数据聚类|深度聚类 A Comprehensive Survey …][^4^]：提供了深度聚类的全面综述，包括方法论、应用和未来研究方向。
[PyTorch学习笔记：nn.KLDivLoss——KL散度损失-CSDN博客][^6^]：详细介绍了PyTorch中KL散度损失函数的使用方法。

最后，如果您希望获得更具体的代码实现建议，可能需要提供更多的上下文信息，例如模型的架构细节、数据集的特定特征等。此外，您也可以考虑在机器学习社区或论坛上寻求帮助，那里有许多经验丰富的从业者和研究者可以提供指导。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

神经网络与深度学习python源码聚类方法
2024-04-20 12:19

通过Python编程语言及其丰富的库支持，我们可以方便地实现各种神经网络模型和聚类算法。同时，利用互联网上的开源资源，学习者可以获取更多关于神经网络与深度学习的实际案例和技术文档，从而加速自己的学习进度。
【无线传感器网络】多级动态优化智能LEACH与成本效益深度信念网络（Matlab代码实现）
2025-10-02 19:16

研究涵盖无线传感器网络中的聚类机制、能耗模型构建、路由优化策略及仿真实验分析，提供了完整的算法实现流程与性能评估方法。; 适合人群：具备一定无线传感器网络基础知识，熟悉Matlab编程，从事物联网、智能感知...
【无线传感器网络】多级【无线传感器网络】多级动态优化智能LEACH与成本效益深度信念网络（Matlab代码实现）动态优化智能LEACH与成本效益深度信念网络（Matlab代码实现）
2025-10-02 18:52

研究还涉及聚类机制优化、簇头选择策略改进以及基于深度学习的能量消耗预测模型，系统地展示了智能算法在无线传感器网络路由优化中的应用价值。; 适合人群：具备一定无线传感器网络基础知识，熟悉Matlab编程，从事...
基于DTW（动态弯曲距离）-Kmeans的时间序列聚类分析模型（Matlab代码实现）
2025-12-08 16:10

无论是在电力系统、深度学习还是无人机技术领域，基于DTW-K-means的时间序列聚类模型均展示出了其在处理时间依赖性数据方面的独特优势。基于DTW-K-means的时间序列聚类分析模型不仅在理论上具有创新性，而且在实际...
基于贝叶斯优化CNN-LSTM混合神经网络预测（Matlab代码实现）
2025-12-08 16:20

贝叶斯优化是一种广泛应用于机器学习和深度学习中的超参数优化技术，尤其在调校复杂的神经网络模型时显示出显著效果。CNN（卷积神经网络）和LSTM（长短期记忆网络）分别在处理空间信息和时间序列数据方面表现出色，...
【电力系统场景生成】基于多头自注意力机制的风电光伏负荷深度卷积嵌入聚类模型设计与实现（含详细可运行代码及解释）
2025-04-29 18:03

内容概要：论文《基于多头自关注的风电、光伏及负荷嵌入式场景聚类》针对高比例可再生能源电力系统中风能、光伏和负荷的不确定性，提出了一种基于多头自关注的深度卷积嵌入聚类模型。该模型首先通过改进的变分模分解...
基于粒子群算法优化FCM聚类的居民用电行为分析研究（Matlab代码实现）
2025-12-09 05:48

基于粒子群算法优化FCM聚类的居民用电行为分析研究主要集中在居民用电行为的分类与分析上。FCM聚类是一种基于模糊理论的聚类算法，通过建立目标函数的最小化来对数据进行分类。然而，在处理复杂的数据集时，FCM聚类...
MATLAB实现NRBO-GMM牛顿-拉夫逊优化算法优化GMM高斯混合聚类的详细项目实例（含完整的程序，GUI设计和代码详解）
2025-04-01 08:08

此外，项目还探讨了未来改进的方向，如增强模型优化算法、结合深度学习、扩展多模态数据处理等。通过持续优化，NRBO-GMM有望成为更强大且易于扩展的聚类分析工具，为各行业的智能化决策提供有力支持。
用于认知负荷评估的集成时空深度聚类（ISTDC）
2024-06-08 13:13

云朵不吃雨的博客本文提出了一种新型的集成时空深度聚类（ISTDC）模型，用于评估认知负荷。该模型首先利用深度表示学习（DRL）将高维EEG数据转换到低维特征空间，然后应用变分贝叶斯高斯混合模型（VBGMM）进行聚类分析。ISTDC模型...
聚类的高斯混合模型研究附Matlab代码.rar
2025-12-16 11:24

高斯混合模型（Gaussian Mixture Model, GMM）是一种基于概率的聚类方法，它假设数据由若干个高斯分布的混合产生，每个高斯分布对应一个聚类簇。在GMM中，数据点属于每个簇的概率由其与簇中心距离决定。这种模型在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 6月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月7日

深度聚类网络模型代码优化

6条回答 默认 最新

问题事件

6条回答默认最新