背景:使用DEAP数据集进行情绪分类,训练好模型之后,想使用预训练模型对无标签的sleep edf数据集进行分类,不考虑分类效果,只想得到分类结果,如何解决输入不一致问题,

# 定义全局变量
channel = [1, 2, 3, 4, 6, 11, 13, 17, 19, 20, 21, 25, 29, 31]  # 14 Channels chosen to fit Emotiv Epoch+
band = [4, 8, 12, 16, 25, 45]  # 5 bands
window_size = 256  # Averaging band power of 2 sec平均频带功率为2秒
step_size = 16  # Each 0.125 sec update once每0.125秒更新一次
sample_rate = 128  # Sampling rate of 128 Hz采样率128 Hz
#  subjectList = ['01', '02', '03', '04', '05', '06', '07', '08', '09', '10', '11', '12', '13', '14', '15', '16', '17',
#                '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', '32']


# FFT with pyeeg
def FFT_Processing(sub, channel, band, window_size, step_size, sample_rate):
    meta = []
    file_path = "data_preprocessed_python"
    file_name = 's' + sub + '.dat'
    file_full_path = os.path.join(file_path, file_name)
    with open(file_full_path, 'rb') as file:

        subject = pickle.load(file, encoding='latin1')  # resolve the python 2 data problem by encoding : latin1

        for i in range(0, 40):
            # loop over 0-39 trails
            data = subject["data"][i]
            labels = subject["labels"][i]
            start = 0 

            while start + window_size < data.shape[1]:
                meta_array = []
                meta_data = []  # meta vector for analysis
                for j in channel:
                    X = data[j][start: start + window_size]  # Slice raw data over 2 sec, at interval of 0.125 sec以0.125秒为间隔，在2秒内对原始数据进行切片
                    Y = pe.bin_power(X, band,
                                     sample_rate)  # FFT over 2 sec of channel j, in seq of theta, alpha, low beta, high beta, gamma
                    meta_data = meta_data + list(Y[0])

                meta_array.append(np.array(meta_data))
                meta_array.append(labels)

                meta.append(np.array(meta_array, dtype=object))
                start = start + step_size

        meta = np.array(meta)
        np.save('out' + sub, meta, allow_pickle=True, fix_imports=True)


for subjects in subjectList:
    FFT_Processing(subjects, channel, band, window_size, step_size, sample_rate)

# 数据划分
# training dataset: 75 %
# validation dataset: 12.5%
# testing dataset: 12.5%

data_training = []
label_training = []
data_testing = []
label_testing = []
# data_validation = []
# label_validation = []

for subjects in subjectList:
    file_path = r"./"
    with open(file_path + '\out' + subjects + '.npy', 'rb') as file:
        sub = np.load(file, allow_pickle=True)
        for i in range(0, sub.shape[0]):
            if i % 8 == 0:
                data_testing.append(sub[i][0])
                label_testing.append(sub[i][1])
            elif i % 8 == 1:
                data_validation.append(sub[i][0])
                label_validation.append(sub[i][1])
            else:
                data_training.append(sub[i][0])
                label_training.append(sub[i][1])
for subjects in subjectList:
    file_path = "./"
    file_name = 'out' + subjects + '.npy'
    file_full_path = os.path.join(file_path, file_name)

    with open(file_full_path, 'rb') as file:

      sub = np.load(file,allow_pickle=True)
      for i in range (0,sub.shape[0]):
        if i % 5 == 0:
          data_testing.append(sub[i][0])
          label_testing.append(sub[i][1])
        else:
          data_training.append(sub[i][0])
          label_training.append(sub[i][1])

np.save('data_training', np.array(data_training), allow_pickle=True, fix_imports=True)
np.save('label_training', np.array(label_training), allow_pickle=True, fix_imports=True)
print("training dataset:", np.array(data_training).shape, np.array(label_training).shape)

np.save('data_testing', np.array(data_testing), allow_pickle=True, fix_imports=True)
np.save('label_testing', np.array(label_testing), allow_pickle=True, fix_imports=True)
print("testing dataset:", np.array(data_testing).shape, np.array(label_testing).shape)

DEAP数据集每个.dat文件包含data和labels，data是40408064矩阵，指
【40次实验，40个通道（前32个是脑电通道），8064指63128（采样时间，采样频率）】。
Labels是404矩阵，指【40次实验，4个维度（valence，arousal，dominace，liking）】。sleep
edf数据集为包含197个整夜的PolySomnoGraphic睡眠记录，其中包含EEG，EOG，下巴EMG和事件标记,我想对其中的eeg信号进行情绪分类,现在主要的问题是输入不一致,最好能给出解决code

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Zyb0627 2023-04-27 10:10

关注

引用chatGPT作答，在处理 sleep edf 数据集时，需要先将原始数据转换为适合模型的格式。一个简单的方法是使用与 DEAP 数据集相同的处理方式。具体来说，可以使用与 DEAP 数据集相同的通道和频段来处理睡眠 EEG 信号，并在相同的时间窗口和时间步长上进行处理。这样就可以将睡眠 EEG 数据集转换为适合情绪分类的格式。

以下是修改后的代码，其中包括将原始数据转换为适合模型的格式和对数据集进行分割：

import os
import numpy as np
import mne

# Define global variables
channel = ['Fp1', 'Fp2', 'F7', 'F3', 'Fz', 'F4', 'F8', 'T3', 'C3', 'Cz', 'C4', 'T4', 'T5', 'P3', 'Pz', 'P4', 'T6', 'O1', 'O2']
band = [4, 8, 12, 16, 25, 45]
window_size = 256  # 2 sec of data
step_size = 16  # 0.125 sec update
sample_rate = 128

# Load sleep EDF dataset
edf_path = './sleep_edf_dataset/sleep-cassette/'
files = os.listdir(edf_path)
data_sleep = []
for f in files:
    if f.endswith('.edf'):
        raw = mne.io.read_raw_edf(os.path.join(edf_path, f))
        raw.set_eeg_reference('average', projection=False)
        data, _ = raw[0:19, :]
        data_sleep.append(data.T)

# FFT with pyeeg
def FFT_Processing(data, channel, band, window_size, step_size, sample_rate):
    meta = []
    for i in range(data.shape[0]):
        # loop over the data
        start = 0
        while start + window_size < data.shape[1]:
            meta_array = []
            meta_data = []  # meta vector for analysis
            for j in channel:
                X = data[i, :, j][start: start + window_size]  # Slice raw data over 2 sec, at interval of 0.125 sec
                Y = pe.bin_power(X, band, sample_rate)  # FFT over 2 sec of channel j
                meta_data = meta_data + list(Y[0])
            meta_array.append(np.array(meta_data))
            meta.append(np.array(meta_array, dtype=object))
            start = start + step_size
    meta = np.array(meta)
    return meta

# Preprocess the sleep EDF dataset
data_processed = []
for i in range(len(data_sleep)):
    data_processed.append(FFT_Processing(data_sleep[i], channel, band, window_size, step_size, sample_rate))
data_processed = np.concatenate(data_processed, axis=0)

# Split the data into training, validation, and testing datasets
data_training, label_training = data_processed[::8], np.zeros((data_processed.shape[0] // 8, 4))
data_testing, label_testing = data_processed[::8], np.zeros((data_processed.shape[0] // 8, 4))
data_validation, label_validation = data_processed[::8], np.zeros((data_processed.shape[0] // 8, 4))

报告相同问题？

关注问题

信号处理-基于DEAP数据集的情绪分类的典型深度学习模型构建（tensorflow版本）
2024-03-27 01:06

在本文中，我们将深入探讨如何使用深度学习技术，特别是基于TensorFlow框架，对DEAP（Dataset for Emotion Analysis using EEG, Physiological and Video Signals）数据集进行情绪分类。DEAP是一个广泛使用的多模态...
使用DEAP数据库进行情感识别_deap_deap数据集_DEAPdataset_使用deap数据集进行情感识别_python_
2021-09-28 21:54

为了利用DEAP数据集进行情感识别，Python编程语言是一个常见选择，因为它有许多强大的库，如NumPy、Pandas、Matplotlib和Scikit-learn，可以用于数据处理、特征提取和模型训练。以下是使用Python进行情感识别的一般...
sentimentclassify master DEAP情绪识别 DEAP数据集分类 DEAP数据集下载 DEAP数据集
2025-07-25 16:51

8（基于DEAP数据集的情绪识别分类）。资源来源于网络分享，仅用于学习交流使用，请勿用于商业，如有侵权请联系我删除！
sentimentclassify-master_DEAP情绪识别_deap数据集分类_DEAP数据集下载_deap数据集_DE
2021-08-09 20:47

本文将深入探讨DEAP数据集及其在情绪识别中的应用，并对如何进行数据集分类和下载进行详细介绍。 DEAP数据集是2012年由英国萨里大学的研究团队推出的一个开放源数据集，主要关注疲劳和情绪的生理信号分析。该数据集...
信号处理-情绪分类数据集DEAP预处理（python版）
2024-03-27 00:49

DEAP原始数据预处理全流程; 基于python环境下的mne库函数。
基于DEAP数据集的情绪识别分类系统
2025-11-23 11:38

基于DEAP数据集的情感认知分类研究本研究聚焦于多模态生理信号在情感状态识别中的应用，通过系统分析DEAP公开数据库中32名受试者的生理数据记录，构建了基于脑电图与外围生理信号的情感分类模型。实验采用改进的...
基于 DEAP 数据集的 EEG 脑电数据情感分析：使用 Python 与 sklearn 实现 SVM、KNN 和树模型分类研究
2025-08-20 07:09

本文档主要研究了使用Python编程语言和sklearn机器学习库，结合支持向量机（SVM）、K最近邻（KNN）以及树模型等分类算法，对基于DEAP数据集的EEG脑电数据进行情感分析的方法。DEAP数据集是一个包含40个受试者观看...
基于DEAP脑电数据集的脑电情绪二分类算法
2025-08-01 15:03

这些模型的选择，考虑到了其在数据集上训练和测试的简便性，同时也保证了对情绪状态二分类问题有足够的解释性和准确性。其中，决策树模型能够提供直观的决策逻辑；SVM模型以其优秀的分类性能在小样本学习中表现突出...
个人收集的deap数据集，脑电信号分类的工程文件
2022-07-01 08:55

个人收集的deap数据集，脑电信号分类的工程文件，有十多个工程，有的有一些说明，值得研究一下。前面是用到的算法，后面是准确率。 1.1D CNN，82.4% 2.KNN，分类器 3.SVM4.CNN 7.ANN-83% 8.ANN-SVM，85% 9.97% 10.4...
deap-eeg-classification:使用DEAP数据集的基于EEG的情绪分类
2021-03-22 14:01

早期分类使用DEAP数据集的基于EEG的情绪分类
对deap数据集进行脑电情绪识别并进行频谱分析（频域特征）
2022-01-02 18:00

之后，我们可以利用机器学习算法（如支持向量机、随机森林或深度学习模型）来训练分类器，用提取的频域特征作为输入，情绪标签作为输出。通过交叉验证和参数调优，可以评估模型的性能，如准确率、召回率和F1分数。 ...
信号处理-情绪分类数据集DEAP预处理（python版）-channel csv数据
2024-04-19 17:57

信号处理--情绪分类数据集DEAP预处理（python版）---channel csv数据
5、情感分类CNN模型：用于DEAP数据集处理
2023-08-15 17:01

是馒头阿的博客上一篇使用sklearn库调用八个机器学习模型对DEAP情感数据进行分类，本篇我自己建立了几个CNN模型去处理，本次研究的目的包括：
基于deap数据集的DEAP_KNN脑电分类算法
2022-02-28 18:44

在这个特定的项目中，"基于deap数据集的DEAP_KNN脑电分类算法"是利用DEAP库进行参数优化，并结合K-Nearest Neighbors（KNN）算法来实现脑电图（EEG）数据的情感分类。脑电图是一种记录大脑电信号的技术，广泛用于...
脑电情绪识别 DEAP数据集 多种方法 CNN LSTM等
2024-01-11 16:50

在使用DEAP数据集进行情绪识别时，首先需要预处理原始EEG数据，包括去除噪声、滤波以消除高频或低频干扰，以及标准化或归一化数据以减少个体差异。接着，可以将预处理后的EEG信号划分为合适的窗口大小，每个窗口对应...
DEAP数据集下的情绪识别分类
2025-05-15 16:49

yong9990的博客通过上述步骤，可有效实现DEAP数据集的情绪分类，根据实际需求调整特征组合和模型参数以优化结果。计算准确率、F1分数、AUC等指标，对比不同特征组合和模型的性能。
深入探索DEAP数据集：基于脑电信号的情绪识别技术详解
2025-08-15 11:19

极度畅想的博客本文介绍了 DEAP 数据集，该数据集专注于通过脑电信号（EEG）、心电图（ECG）等生理信号进行情感分析，由伦敦多所高校研究人员创建，为情绪识别算法提供标准化资源。文章阐述其数据采集过程、文件结构及预处理方法，...
DEAP数据集，需要自己下载提取码
2023-12-15 15:03

文件比较大，2.71G，需要的自己下载，这里只有网盘链接，提取码要下载 https://pan.baidu.com/s/1Ow0ZMYwdGFLndPh_qKvuPQ
基于监督学习和支持向量机，K-最近邻算法对DEAP数据集进行脑电情绪识别分析
2022-01-02 18:14

使用DEAP数据集中记录的EEG信号对情绪进行分类，以使用机器学习算法（如支持向量机和K - 最近邻）实现高精度得分。 1）将数据集存储在文件夹中 - > data/ 2）运行 runFile.py 文件
基于DEAP数据集的脑电情绪识别.rar
2021-11-22 20:24

在本项目中，研究人员利用了DEAP数据集进行脑电情绪识别的研究，这是一种广泛用于情感分析和生物信号处理的数据集。DEAP（DEAP：Dataset for Emotion Analysis using EEG, Physiological signals and Video）包含了...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月27日

背景:使用DEAP数据集进行情绪分类,训练好模型之后,想使用预训练模型对无标签的sleep edf数据集进行分类,不考虑分类效果,只想得到分类结果,如何解决输入不一致问题,

2条回答 默认 最新

问题事件

2条回答默认最新