如何把激活函数前的值取出来，机器学习

代码如下，抄的代码 https://github.com/Yura52/rtdl/blob/main/examples/rtdl.ipynb

现在做机器学习，如何在这个例子中，把深度学习模型激活函数之前的最后一层值取出来？我想验证下网络有没有起作用。

# Requirements:
!pip install rtdl
!pip install libzero==0.0.4
from typing import Any, Dict

import numpy as np
import rtdl
import scipy.special
import sklearn.datasets
import sklearn.metrics
import sklearn.model_selection
import sklearn.preprocessing
import torch
import torch.nn as nn
import torch.nn.functional as F
import delu
device = torch.device('cpu')
# Docs: https://yura52.github.io/zero/0.0.4/reference/api/zero.improve_reproducibility.html
delu.improve_reproducibility(seed=123456)
# !!! NOTE !!! The dataset splits, preprocessing and other details are
# significantly different from those used in the
# paper "Revisiting Deep Learning Models for Tabular Data",
# so the results will be different from the reported in the paper.

dataset = sklearn.datasets.fetch_california_housing()
task_type = 'regression'

# dataset = sklearn.datasets.fetch_covtype()
# task_type = 'multiclass'

assert task_type in ['binclass', 'multiclass', 'regression']

X_all = dataset['data'].astype('float32')
y_all = dataset['target'].astype('float32' if task_type == 'regression' else 'int64')
if task_type != 'regression':
    y_all = sklearn.preprocessing.LabelEncoder().fit_transform(y_all).astype('int64')
n_classes = int(max(y_all)) + 1 if task_type == 'multiclass' else None

X = {}
y = {}
X['train'], X['test'], y['train'], y['test'] = sklearn.model_selection.train_test_split(
    X_all, y_all, train_size=0.8
)
X['train'], X['val'], y['train'], y['val'] = sklearn.model_selection.train_test_split(
    X['train'], y['train'], train_size=0.8
)

# not the best way to preprocess features, but enough for the demonstration
preprocess = sklearn.preprocessing.StandardScaler().fit(X['train'])
X = {
    k: torch.tensor(preprocess.transform(v), device=device)
    for k, v in X.items()
}
y = {k: torch.tensor(v, device=device) for k, v in y.items()}

# !!! CRUCIAL for neural networks when solving regression problems !!!
if task_type == 'regression':
    y_mean = y['train'].mean().item()
    y_std = y['train'].std().item()
    y = {k: (v - y_mean) / y_std for k, v in y.items()}
else:
    y_std = y_mean = None

if task_type != 'multiclass':
    y = {k: v.float() for k, v in y.items()}


d_out = n_classes or 1

# model = rtdl.MLP.make_baseline(
#     d_in=X_all.shape[1],
#     d_layers=[128, 256, 128],
#     dropout=0.1,
#     d_out=d_out,
# )
# lr = 0.001
# weight_decay = 0.0

# model = rtdl.ResNet.make_baseline(
#     d_in=X_all.shape[1],
#     d_main=128,
#     d_intermidiate=256,
#     dropout_first=0.2,
#     dropout_second=0.0,
#     n_blocks=2,
#     d_out=d_out,
# )
# lr = 0.001
# weight_decay = 0.0

model = rtdl.FTTransformer.make_default(
    n_num_features=X_all.shape[1],
    cat_cardinalities=None,
    last_layer_query_idx=[-1],  # it makes the model faster and does NOT affect its output
    d_out=d_out,
)

# === ABOUT CATEGORICAL FEATURES ===
# IF you use MLP, ResNet or any other simple feed-forward model (NOT transformer-based model)
# AND there are categorical features
# THEN you have to implement a wrapper that handles categorical features.
# The example below demonstrates how it can be achieved using rtdl.CategoricalFeatureTokenizer.
# ==================================
# 1. When you have both numerical and categorical features, you should prepare you data like this:
#    (X_num, X_cat) instead of X
#    Each column in X_cat should contain values within the range from 0 to <(the number of unique values in column) - 1>;
#    use sklean.preprocessing.OrdinalEncoder to achieve this;
# 2. Prepare a list of so called "cardinalities":
#    cardinalities[i] = 
# 3. See the commented example below and adapt it for your needs.
#
# class Model(nn.Module):
#     def __init__(
#         self,
#         n_num_features: int,
#         cat_tokenizer: rtdl.CategoricalFeatureTokenizer,
#         mlp_kwargs: Dict[str, Any],
#     ):
#         super().__init__()
#         self.cat_tokenizer = cat_tokenizer
#         self.model = rtdl.MLP.make_baseline(
#             d_in=n_num_features + cat_tokenizer.n_tokens * cat_tokenizer.d_token,
#             **mlp_kwargs,
#         )
#
#     def forward(self, x_num, x_cat):
#         return self.model(
#             torch.cat([x_num, self.cat_tokenizer(x_cat).flatten(1, -1)], dim=1)
#         )
#
# model = Model(
#     # `None` means "Do not transform numerical features"
#     # `d_token` is the size of embedding for ONE categorical feature
#     X_num_all.shape[1],
#     rtdl.CategoricalFeatureTokenizer(cardinalities, d_token, True, 'uniform'),
#     mlp_kwargs,
# )
# Then the model should be used as `model(x_num, x_cat)` instead of of `model(x)`.

model.to(device)
optimizer = (
    model.make_default_optimizer()
    if isinstance(model, rtdl.FTTransformer)
    else torch.optim.AdamW(model.parameters(), lr=lr, weight_decay=weight_decay)
)
loss_fn = (
    F.binary_cross_entropy_with_logits
    if task_type == 'binclass'
    else F.cross_entropy
    if task_type == 'multiclass'
    else F.mse_loss
)

def apply_model(x_num, x_cat=None):
    if isinstance(model, rtdl.FTTransformer):
        return model(x_num, x_cat)
    elif isinstance(model, (rtdl.MLP, rtdl.ResNet)):
        assert x_cat is None
        return model(x_num)
    else:
        raise NotImplementedError(
            f'Looks like you are using a custom model: {type(model)}.'
            ' Then you have to implement this branch first.'
        )


@torch.no_grad()
def evaluate(part):
    model.eval()
    prediction = []
    for batch in delu.iter_batches(X[part], 1024):
        prediction.append(apply_model(batch))
    prediction = torch.cat(prediction).squeeze(1).cpu().numpy()
    target = y[part].cpu().numpy()

    if task_type == 'binclass':
        prediction = np.round(scipy.special.expit(prediction))
        score = sklearn.metrics.accuracy_score(target, prediction)
    elif task_type == 'multiclass':
        prediction = prediction.argmax(1)
        score = sklearn.metrics.accuracy_score(target, prediction)
    else:
        assert task_type == 'regression'
        score = sklearn.metrics.mean_squared_error(target, prediction) ** 0.5 * y_std
    return score


# Create a dataloader for batches of indices
# Docs: https://yura52.github.io/zero/reference/api/zero.data.IndexLoader.html
batch_size = 256
train_loader = delu.data.IndexLoader(len(X['train']), batch_size, device=device)

# Create a progress tracker for early stopping
# Docs: https://yura52.github.io/zero/reference/api/zero.ProgressTracker.html
progress = delu.ProgressTracker(patience=100)

print(f'Test score before training: {evaluate("test"):.4f}')

n_epochs = 1000
report_frequency = len(X['train']) // batch_size // 5
for epoch in range(1, n_epochs + 1):
    for iteration, batch_idx in enumerate(train_loader):
        model.train()
        optimizer.zero_grad()
        x_batch = X['train'][batch_idx]
        y_batch = y['train'][batch_idx]
        loss = loss_fn(apply_model(x_batch).squeeze(1), y_batch)
        loss.backward()
        optimizer.step()
        if iteration % report_frequency == 0:
            print(f'(epoch) {epoch} (batch) {iteration} (loss) {loss.item():.4f}')

    val_score = evaluate('val')
    test_score = evaluate('test')
    print(f'Epoch {epoch:03d} | Validation score: {val_score:.4f} | Test score: {test_score:.4f}', end='')
    progress.update((-1 if task_type == 'regression' else 1) * val_score)
    if progress.success:
        print(' <<< BEST VALIDATION EPOCH', end='')
    print()
    if progress.fail:
        break

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Jackyin0720 2022-10-28 08:12
关注
通过利用keras 获得最后一层的输出值

from keras import backend as K get_layer_output = K.function([model.layers[index_1].input, model.layers[index_2].input], [model.layers[index_3].output]) layer_output = get_layer_output([train_x_1, train_x_2])[0]

【注解：
通过模型中的多个输入和多个输出，但是需要的最终输出结果只有一个，这个输出结果需要用到两个输入数据，因此，设置两个输入：

model.layers[index_1].input,和model.layers[index_2].input，

然后设置了一个输出：model.layers[index_3].output。
其中index_1,2,3表示模型中所在的层数，下标从0开始。
model表示训练好的模型名称。】
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

R语言怎么编写分段函数 r语言有问必答
2021-10-29 17:41

回答 1 已采纳代码这样写即可： f<-function(x){ if (x<2) y=x+1 else if (x>=2 && x<=8) y=3*x
编程计算分段函数输入x的值，输出y的值 python
2021-10-18 15:02

回答 3 已采纳 import math x=eval(input()) if x>5: print('y=',math.sin(x)+math.sqrt(math.pow(x,2)+1)) elif
机器学习模型的损失函数，是如何进行选取的？人工智能数据挖掘机器学习深度学习
2019-04-16 14:05

回答 1 已采纳 # 如果问题解决，请采纳本回答和 https://ask.csdn.net/questions/756673 和 https://ask.csdn.net/questions/755296 # 否则
吴恩达机器学习matlab编程作业
2023-11-04 16:29

在本项目中，“吴恩达机器学习matlab编程作业”涵盖了四个主要的机器学习实践环节，包括线性回归、逻辑回归、前向神经网络以及BP（反向传播）神经网络。MATLAB作为一种强大的数学计算软件，是进行这些复杂算法实现的...
bp神经网络各层激活函数的选择 matlab 有问必答神经网络问答团队
2021-05-25 18:45

回答 2 已采纳以下是我想出来的几个思路用于重新考虑你自己的神经网络。 1. 你用了几层神经网络？一层神经网络很可能无法解决异或等线性不可分问题，多层神经网络加上非线性激活函数可以解决这一问题。 2. 你是自己手
R语言自定义函数条件求和 r语言有问必答
2021-04-18 02:56

回答 4 已采纳在函数内少写了打印语句。在代码中最后两个}之间加上一句print(i)即可。 sumN<-function(x,n){ i = 0 for(x in 1:n){ if
c语言，分段函数求值 c# c语言
2022-03-18 16:55

回答 1 已采纳 #include<stdio.h> #include<math.h> int main() { float x, f; printf("请输入x的值：");
原来ReLU这么好用？一文带你深度了解ReLU激活函数
2022-01-24 20:11

Java技能树的博客在神经网络中，激活函数负责将来自节点的加权输入转换为该输入的节点或输出的激活。ReLU 是一个分段线性函数，如果输入为正，它将直接输出，否则，它将输出为零。它已经成为许多类型神经网络的默认激活函数，因为...
如何利用MATLAB求函数最大值对应的自变量 matlab 有问必答
2021-06-19 18:31

回答 3 已采纳命令行分别输入： syms x; y = -x^2 == 0; x = solve(y,x)
R语言file函数错误，无效的“description”属性 r语言有问必答
2022-04-04 17:28

回答 2 已采纳是用files函数， list.files(dir(pattern = "*.log")) 匹配类型写成：dir(pattern = "*.log")
Java语言怎么实现一个函数返回2个返回值开发语言
2019-10-05 14:33

回答 2 已采纳如果想让一个方法返回的时候带着多项信息，可直接返回一个对象，也可以传入一个对象作为参数，在该方法体中修改改对象的相应的属性，方法返回空。如果想像 println 那样多次调用，可以收集 retu
R语言实现sigmoid激活函数并可视化
2022-02-04 08:37

Data+Science+Insight的博客 R语言实现sigmoid激活函数并可视化 sigmoid激活函数又叫作 Logistic 激活函数，它将实数值压缩进 0 到 1 的区间内，还可以在预测概率的输出层中使用。该函数将大的负数转换成 0，将大的正数转换成 1。数学公式为...
vb编程语言中实现启动项目从下拉中添加自己的函数，怎么实现？
2016-12-27 16:15

回答 2 已采纳不知道你说的“下拉”是什么，可以看看combo控件的用法
【一起啃西瓜书】机器学习-期末复习（不挂科）
2021-12-11 14:02

chaser&upper的博客【机器学习-期末复习爆肝2w字笔记整理分享】《机器学习》致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，从而在计算机上从数据（经验）中产生“模型”，用于对新的情况给出判断（利用此模型预测未来...
神经网络和深度学习（2）-- 激活函数
2019-08-11 14:45

ShaneHolmes的博客什么是激活函数2. 为什么要使用激活函数3. 激活函数的种类4. 不同激活函数的使用场景5. 激活函数的导数神经网络和深度学习系列笔记：传送门【前言】使用一个神经网络时，需要决定使用哪种激活函数用隐藏层上，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月28日

悬赏问题

¥15 python怎么在已有视频文件后添加新帧
¥20 虚幻UE引擎如何让多个同一个蓝图的NPC执行一样的动画,
¥15 fluent里模拟降膜反应的UDF编写
¥15 MYSQL 多表拼接link
¥15 关于某款2.13寸墨水屏的问题
¥15 obsidian的中文层级自动编号
¥15 同一个网口一个电脑连接有网，另一个电脑连接没网
¥15 神经网络模型一直不能上GPU
¥15 pyqt怎么把滑块和输入框相互绑定，求解决！
¥20 wpf datagrid单元闪烁效果失灵

如何把激活函数前的值取出来，机器学习

6条回答 默认 最新

问题事件

悬赏问题

6条回答默认最新