MAML写的对不对，望指导

感觉测试效果很差不知道是怎么回事
希望指点一波

import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  # 忽略低级别警告
from sklearn.metrics import confusion_matrix
import tensorflow as tf
from matplotlib import pyplot as plt
import numpy as np
from scipy.fftpack import fft
import time


now_time = time.time()


def yuchuli(data, label):
    a = np.loadtxt(data, dtype=np.float32)
    a = a[0:12000]
    a = a.reshape(30, 400)

    # 转换成频域数据
    data1 = fft(a).T                             # 快速傅里叶变换
    xf1 = abs(data1) / len(data1)                # 归一化处理
    xf2 = xf1[range(int(len(data1) / 2))]        # 取前面一半
    data1 = xf2
    data1 = tf.cast(data1, dtype=tf.float32)
    data1 = tf.transpose(data1)                  # 矩阵转置

    # 标签转换成独热编码
    lab1 = np.array([label for i in range(0, 30)])
    lab1 = tf.one_hot(lab1, depth=6)
    return data1, lab1


def load_csv():
    # 训练任务类别
    data1, lab1 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\normal_x098_de.csv', 0)
    data2, lab2 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\b07_de.csv', 1)
    data3, lab3 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\b14_de.csv', 2)
    data4, lab4 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\b21_de.csv', 3)
    data5, lab5 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\ir07_de.csv', 4)
    data6, lab6 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\ir14_de.csv', 5)

    # 测试任务类别
    data7, lab7 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\ir21_de.csv', 0)
    data8, lab8 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\or07@6_de.csv', 1)
    data9, lab9 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\or14@6_de.csv', 2)
    data10, lab10 = yuchuli('C:\\Users\\pc.000\\Desktop\\数据集\\轴承数据十分类\\or21@6_de.csv', 3)
    return data1, lab1, data2, lab2, data3, lab3, data4, lab4, data5, lab5, data6, lab6, data7, lab7, data8, lab8, data9, lab9, data10, lab10

# 加载数据
data1, lab1, data2, lab2, data3, lab3, data4, lab4, data5, lab5, data6, lab6, data7, lab7, data8, lab8, data9, lab9, data10, lab10 = load_csv()

lab = (lab1, lab2, lab3, lab4, lab5, lab6)
data = (data1, data2, data3, data4, data5, data6)
m_arr = np.array(lab)
n_arr = np.array(data)


# 定义抽样本构成分布的函数
def qushu(d, l):             # d: data数据   l: label标签
    d_s = []                 # d_s: data_support 支持集数据
    l_s = []                 # l_s: label_support 支持集标签

    suo1 = np.random.choice(30, 20, replace=False)   # 30个数字取10个，False不可以重复
    for i1 in range(len(suo1)):
        index1 = suo1[i1]
        d_s.append(d[index1])  # 30个样本随机抽取20个
        l_s.append(l[index1])  # 30个样本随机抽取20个
    t_d_s = d_s[0:5]           # t_d_s = task_data_support   支持集数据   20个样本抽5个，5×400
    t_l_s = l_s[0:5]           # t_d_s = task_label_support  支持集标签   5×4
    t_d_q = d_s[5:]            # t_d_s = task_data_query     查询集数据   20个样本抽5个，剩余的15个样本，15×400
    t_l_q = l_s[5:]            # t_d_s = task_label_query    查询集标签   15×4

    t_d_s = np.array(t_d_s)
    t_l_s = np.array(t_l_s)
    t_d_q = np.array(t_d_q)
    t_l_q = np.array(t_l_q)
    return t_d_s, t_l_s, t_d_q, t_l_q


"""构造训练任务分布，抽一百次，有一百个训练任务，每个任务的支持集样本数：4×5=20；查询集样本数：4×15=60，
每个任务的支持集维度：20×400；查询集维度：60×400；"""
x_s = []
y_s = []
x_q = []
y_q = []

for i in range(100):
    suo = np.random.choice(6, 4, replace=False)
    lab_1 = m_arr[suo[0], :]
    data_1 = n_arr[suo[0], :]
    lab_2 = m_arr[suo[1], :]
    data_2 = n_arr[suo[1], :]
    lab_3 = m_arr[suo[2], :]
    data_3 = n_arr[suo[2], :]
    lab_4 = m_arr[suo[3], :]
    data_4 = n_arr[suo[3], :]

    """data1: 30×400   label: 30×4   t_d_s0: 5×400;  t_l_s0: 5×4;  t_d_s0: 5×400;  t_l_q0: 5×5"""
    t_d_s0, t_l_s0, t_d_q0, t_l_q0 = qushu(data_1, lab_1)
    t_d_s1, t_l_s1, t_d_q1, t_l_q1 = qushu(data_2, lab_2)
    t_d_s2, t_l_s2, t_d_q2, t_l_q2 = qushu(data_3, lab_3)
    t_d_s3, t_l_s3, t_d_q3, t_l_q3 = qushu(data_4, lab_4)

    x1_s = np.vstack((t_d_s0, t_d_s1, t_d_s2, t_d_s3))  # 20×400   4-way  5-shot  15-query
    y1_s = np.vstack((t_l_s0, t_l_s1, t_l_s2, t_l_s3))  # 20×4
    x1_q = np.vstack((t_d_q0, t_d_q1, t_d_q2, t_d_q3))  # 60×400
    y1_q = np.vstack((t_l_q0, t_l_q1, t_l_q2, t_l_q3))  # 60×4

    x_s.append(x1_s)
    y_s.append(y1_s)
    x_q.append(x1_q)
    y_q.append(y1_q)
"""x_s是一个列表，x_q[i]是抽取的第i个任务"""


# 初始化参数，3层bp
def init_fen(n1, n_h1, n_h2, n_h3, n2):
    # 截断式正态分布就是在标准正态分（高斯分布）布的基础上加以限制，以使得生成的数据在一定范围上。
    # 如：标准正态分布生生成的数据在负无穷到正无穷，但是截断式正态分布生成的数据在（均值-2倍的标准差，均值+2倍的标准差）这个范围内,生成的数比较靠经。
    w1 = tf.Variable(tf.random.truncated_normal([n1, n_h1], stddev=1. / tf.sqrt(float(n1))))
    b1 = tf.Variable(tf.zeros([n_h1]))
    w2 = tf.Variable(tf.random.truncated_normal([n_h1, n_h2], stddev=1. / tf.sqrt(float(n_h1))))
    b2 = tf.Variable(tf.zeros([n_h2]))
    w3 = tf.Variable(tf.random.truncated_normal([n_h2, n_h3], stddev=1. / tf.sqrt(float(n_h2))))
    b3 = tf.Variable(tf.zeros([n_h3]))
    w4 = tf.Variable(tf.random.truncated_normal([n_h3, n2], stddev=1. / tf.sqrt(float(n_h3))))
    b4 = tf.Variable(tf.zeros([n2]))
    return w1, b1, w2, b2, w3, b3, w4, b4


# 前向传播
def fe_forw(x, w1, b1, w2, b2, w3, b3, w4, b4):
    z1 = tf.matmul(x, w1) + b1
    a1 = tf.nn.relu(z1)
    z2 = tf.matmul(a1, w2) + b2
    a2 = tf.nn.relu(z2)
    z3 = tf.matmul(a2, w3) + b3
    a3 = tf.nn.relu(z3)
    z4 = tf.matmul(a3, w4) + b4
    a4 = tf.nn.softmax(z4)
    return a4


# 定义训练任务内循环计算
def meta_inner_train(w1, b1, w2, b2, w3, b3, w4, b4, x_s, y_s, x_q, y_q):
    epos = 0
    max_epos = 5
    # lr = 0.05

    while True:
        with tf.GradientTape() as tape:

            a4_s = fe_forw(x_s, w1, b1, w2, b2, w3, b3, w4, b4)
            loss = tf.reduce_mean(tf.square(y_s - a4_s))  # 求平均值，这里是20个样本的损失平均值

        optimizer = tf.keras.optimizers.Adam(lr=0.01)
        grads = tape.gradient(loss, [w1, b1, w2, b2, w3, b3, w4, b4])
        optimizer.apply_gradients(zip(grads, [w1, b1, w2, b2, w3, b3, w4, b4]))

        # grads = tape.gradient(loss, [w1, b1, w2, b2, w3, b3, w4, b4])
        # w1.assign_sub(lr * grads[0])
        # b1.assign_sub(lr * grads[1])
        # w2.assign_sub(lr * grads[2])
        # b2.assign_sub(lr * grads[3])
        # w3.assign_sub(lr * grads[4])
        # b3.assign_sub(lr * grads[5])
        # w4.assign_sub(lr * grads[6])
        # b4.assign_sub(lr * grads[7])

        la = tf.argmax(a4_s, axis=1)
        y_tr_1 = tf.argmax(y_s, axis=1)

        cor_tr1 = tf.cast(tf.equal(la, y_tr_1), dtype=tf.int32)
        cor_tr1 = tf.reduce_sum(cor_tr1)  # 支持集样本对了几个

        num1 = x_s.shape[0]               # 支持集样本数量（这里我取的是20个）
        acc_s = cor_tr1 / num1            # 支持集样本判断正确率

        if epos % 1 == 0:
            print('epos = {}, loss = {:.4f}, acc_s = {:.4f}, 对了 = {}, 支持集总数 = {}'.format(epos, loss, acc_s, cor_tr1, num1))
        if loss < 0.001:
            break
        if acc_s == 1.0:
            break
        if epos == max_epos:
            break
        else:
            epos += 1

    w1_q, b1_q, w2_q, b2_q, w3_q, b3_q, w4_q, b4_q = w1, b1, w2, b2, w3, b3, w4, b4  # 查询集的初始参数=训练好的支持集参数
    with tf.GradientTape() as tape:

        a4_q = fe_forw(x_q, w1_q, b1_q, w2_q, b2_q, w3_q, b3_q, w4_q, b4_q)
        losq = tf.reduce_mean(tf.square(y_q - a4_q))  # 查询集60个样本的损失平均值

    gradq = tape.gradient(losq, [w1_q, b1_q, w2_q, b2_q, w3_q, b3_q, w4_q, b4_q])

    # w1.assign_sub(lr* gradq[0])  # 这里应该更新元模型的参数
    # b1.assign_sub(lr * gradq[1])
    # w2.assign_sub(lr * gradq[2])
    # b2.assign_sub(lr* gradq[3])
    # w3.assign_sub(lr * gradq[4])
    # b3.assign_sub(lr * gradq[5])
    # w4.assign_sub(lr * gradq[6])
    # b4.assign_sub(lr * gradq[7])
    return gradq[0], gradq[1], gradq[2], gradq[3], gradq[4], gradq[5], gradq[6], gradq[7], losq  # 记录查询集的梯度，用来更新元模型参数


# 定义训练任务外循环计算
def meta_outer_train(w1, b1, w2, b2, w3, b3, w4, b4, x_s, y_s, x_q, y_q):
    grw1, grb1, grw2, grb2, grw3, grb3, grw4, grb4 = 0, 0, 0, 0, 0, 0, 0, 0       # 收集训练任务查询集的梯度用这个梯度来更新元模型参数
    lr_y = 0.005
    losq = 0
    epo_s = 0
    max_epos = 6

    """迭代次数，伪代码3-10一个循环，这里是元模型更新参数的次数，因为这里是100个任务全部投入训练，
    没有分batch，所以元模型正常只会更新一次，这里设置的是最大更新45次"""

    while True:

        for i in range(100):  # i：训练任务数，要计算每个任务的loss

            print('在训练第{}个任务'.format(i))

            grw1_t, grb1_t, grw2_t, grb2_t, grw3_t, grb3_t, grw4_t, grb4_t, losq_t = meta_inner_train(w1, b1, w2, b2, w3, b3, w4,
                                                                                         b4, x_s[i], y_s[i], x_q[i], y_q[i])
            # grw1 = grw1 + grw1_t， 聚合这一百个任务的梯度，这里面没有分batch，相当于一个batch100个任务
            grw1 += grw1_t
            grb1 += grb1_t
            grw2 += grw2_t
            grb2 += grb2_t
            grw3 += grw3_t
            grb3 += grb3_t
            grw4 += grw4_t
            grb4 += grb4_t
            losq += losq_t

        """用一百个任务的梯度更新元模型梯度"""
        w1.assign_sub(lr_y * grw1)
        b1.assign_sub(lr_y * grb1)
        w2.assign_sub(lr_y * grw2)
        b2.assign_sub(lr_y * grb2)
        w3.assign_sub(lr_y * grw3)
        b3.assign_sub(lr_y * grb3)
        w4.assign_sub(lr_y * grw4)
        b4.assign_sub(lr_y * grb4)

        if epo_s % 1 == 0:
            print('*' * 150)
            print('*' * 150)
            print('epo_s = {}, losq = {:.4f}'.format(epo_s, losq))
            print('*' * 150)
            print('*' * 150)
        # if losq < 40:
        #     break
        if epo_s == max_epos:
            break
        else:
            epo_s += 1

    return w1, b1, w2, b2, w3, b3, w4, b4   # 训练好的元模型的参数


# 定义元微调计算
def meta_fine_tune(w1, b1, w2, b2, w3, b3, w4, b4, x_s, y_s, x_q, y_q):

    lr = 0.005
    epos = 0
    max_epos = 100  # 元学习测试任务的支持集可以迭代很多次

    while True:
        with tf.GradientTape() as tape:

            a4_s = fe_forw(x_s, w1, b1, w2, b2, w3, b3, w4, b4)
            loss = tf.reduce_mean(tf.square(y_s - a4_s))

        optimizer = tf.keras.optimizers.Adam(lr=0.1)
        grads = tape.gradient(loss, [w1, b1, w2, b2, w3, b3, w4, b4])
        optimizer.apply_gradients(zip(grads, [w1, b1, w2, b2, w3, b3, w4, b4]))

        # w1.assign_sub(lr * grads[0])
        # b1.assign_sub(lr * grads[1])
        # w2.assign_sub(lr * grads[2])
        # b2.assign_sub(lr * grads[3])
        # w3.assign_sub(lr * grads[4])
        # b3.assign_sub(lr * grads[5])
        # w4.assign_sub(lr * grads[6])
        # b4.assign_sub(lr * grads[7])

        la = tf.argmax(a4_s, axis=1)
        y_tr_1 = tf.argmax(y_s, axis=1)

        cor_tr = tf.cast(tf.equal(la, y_tr_1), dtype=tf.int32)
        cor_tr = tf.reduce_sum(cor_tr)

        num = x_s.shape[0]
        acc_s = cor_tr / num   # 测试阶段支持集精度

        if epos % 1 == 0:
            print('epos = {}, 微调loss = {:.4f}, 微调acc_s = {:.4f}, 对了 = {}, 样本数 = {}'.format(epos, loss, acc_s, cor_tr, num))
        if loss < 0.001:
            # print('loss = {:.4f}, acc_s = {:.4f}'.format(loss, acc_s))
            break
        if acc_s == 1.0:
            print(acc_s)
            break
        if epos == max_epos:
            break
        else:
            epos += 1

    # 真正的测试，用测试任务的查询集测试
    a4_q = fe_forw(x_q, w1, b1, w2, b2, w3, b3, w4, b4)

    laq = tf.argmax(a4_q, axis=1)
    y_te_1 = tf.argmax(y_q, axis=1)

    cor_te = tf.cast(tf.equal(laq, y_te_1), dtype=tf.int32)
    cor_te = tf.reduce_sum(cor_te)

    numq = x_q.shape[0]
    acc_q = cor_te / numq   # 测试阶段查询集的精度

    return acc_q


# 定义测试任务中查询集计算（真正的测试）
def online_test(w1, b1, w2, b2, w3, b3, w4, b4, n_test):
    acc_all = []
    # 抽50个测试任务，每个任务都有支持集和查询集
    for i in range(n_test):
        print('在测试第{}个任务'.format(i))
        t_d_s0, t_l_s0, t_d_q0, t_l_q0 = qushu(data7, lab7)
        t_d_s1, t_l_s1, t_d_q1, t_l_q1 = qushu(data8, lab8)
        t_d_s2, t_l_s2, t_d_q2, t_l_q2 = qushu(data9, lab9)
        t_d_s3, t_l_s3, t_d_q3, t_l_q3 = qushu(data10, lab10)

        x_s = np.vstack((t_d_s0, t_d_s1, t_d_s2, t_d_s3))
        y_s = np.vstack((t_l_s0, t_l_s1, t_l_s2, t_l_s3))
        x_q = np.vstack((t_d_q0, t_d_q1, t_d_q2, t_d_q3))
        y_q = np.vstack((t_l_q0, t_l_q1, t_l_q2, t_l_q3))

        acc_q = meta_fine_tune(w1, b1, w2, b2, w3, b3, w4, b4, x_s, y_s, x_q, y_q)
        acc_all.append(acc_q)  # 10个测试任务的查询集的10个精度
        print('i = {}, acc_q = {:.4f}'.format(i, acc_q))

    acc = tf.reduce_mean(acc_all)  # 50个测试任务的平均精度，防止极端情况
    return acc, acc_all


n_train = 100  # 抽取多少个训练任务
n_test = 10    # 抽取多少个测试任务，一般测试任务抽一个就行，但是在实际操作中，一般都抽取多个任务，将查询集精度平均，防止极端情况

# 初始化元模型参数
w1_0, b1_0, w2_0, b2_0, w3_0, b3_0, w4_0, b4_0 = init_fen(200, 600, 200, 50, 6)

# 元学习训练阶段训练出新的元模型参数
w1_1, b1_1, w2_1, b2_1, w3_1, b3_1, w4_1, b4_1 = meta_outer_train(w1_0, b1_0, w2_0, b2_0, w3_0, b3_0, w4_0, b4_0, x_s, y_s, x_q, y_q)

# 元学习测试新任务
acc, acc_all = online_test(w1_1, b1_1, w2_1, b2_1, w3_1, b3_1, w4_1, b4_1, n_test)

print('*' * 50)
print('acc = ', acc)
total_time = time.time() - now_time
print("total_time", total_time)
print(acc_all)

# 绘制 Accuracy 曲线
plt.figure()
plt.title('Acc Curve')                  # 图片标题，curve：曲线
plt.xlabel('i')                         # x轴变量名称
plt.ylabel('Acc')                       # y轴变量名称
plt.plot(acc_all, label="$Accuracy$")   # 逐点画出test_acc值并连线，连线图标是Accuracy
plt.legend()
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-04-23 22:07
关注
文章：深度学习之MAML笔记中也许有你想要的答案，请看下吧
除此之外, 这篇博客: MAML代码踩坑中的 定义一些基本的参数： 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
N-way K-shot在广义上来讲N代表类别数量，K代表每一类别中样本数量

这里采用了n_way = 5 ，k-shot 在在support=1，在query=15，8个任务

### 准备数据迭代器 n_way = 5 ## N-way K-shot在广义上来讲N代表类别数量，K代表每一类别中样本数量 k_spt = 1 ## support data 的个数 k_query = 15 ## query data 的个数 imgsz = 28 resize = imgsz task_num = 8 batch_size = task_num

以下回答由chatgpt基于相关博客总结生成:
回答：

首先需要明确，MAML是一种元学习算法，主要应用于小样本学习。因此，在使用MAML进行测试时，需要考虑以下几个方面：

1.数据准备和迭代器：

根据参考资料中的代码，可以看出数据准备和迭代器是非常重要的，需要注意以下几点：

对于小样本学习而言，数据数量非常少，因此在训练过程中，需要采用N-way K-shot的策略，即每次从N个类别中选择K个样本来训练模型。

在训练过程中，需要使用support set和query set。其中，support set用来训练模型，query set用来测试模型。

在使用MAML时，需要对数据进行缓存，以便进行多次迭代。

因此，如果想要提高MAML的测试效果，可以考虑优化数据准备和迭代器的过程，以增加数据的多样性和丰富性。

2.模型设计和参数设置：

在使用MAML进行测试时，模型的设计和参数设置也是非常关键的。需要考虑以下几个方面：

选择合适的网络架构。MAML可以应用于不同的网络架构，例如卷积神经网络、循环神经网络等，但是需要注意的是，网络架构的选择需要根据具体的任务和数据类型进行调整。

调整超参数。MAML中涉及到很多超参数，例如learning rate、batch size等，这些超参数的选择会影响到模型的性能。因此，在进行测试时，需要根据实际情况对这些超参数进行调整。

设计损失函数。MAML中涉及到两个损失函数，一个是在support set上的损失函数，一个是在query set上的损失函数。因此，在设计损失函数时，需要考虑这两个方面，并且需要对二者进行平衡，以达到最佳的测试效果。

总之，要想提高MAML的测试效果，需要从数据准备、模型设计和参数设置等方面入手，对每一个细节进行优化和调整。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

直接扒下来的MAML_RL项目运行怎么报错了(标签-python) python
2023-03-26 11:46

回答 1 已采纳错误提示中有一行"except Exception,e0:"，这个语法在Python 3.x中是不支持的，因为在Python 3.x中，except语句应该使用"as"关键字来捕获异常，而不是使用逗号
MAML_rl项目调参后出现AttributeError: 'Namespace' object has no attribute 'config' python
2023-03-29 13:53

回答 1 已采纳这个错误提示表明你的代码中某个地方调用了config属性，但是Namespace对象中并没有这个属性。这可能是由于你修改了命令行参数的名称或者参数配置文件的格式。在MAML_rl中，通常使用argp
meta learning 深度学习神经网络
2023-04-12 10:58

回答 2 已采纳以下内容部分参考ChatGPT模型： MAML训练阶段学到的能力是快速适应新任务的能力，也就是说，MAML通过在多个任务上学习如何学习，从而使得在面对新任务时，能够更快速地适应新任务的特点。测试阶段
基于动态编程的元学习方法——Dynamic Program Prior (DPP)，用于降低元学习过程中的重复计算量
2023-08-03 02:43

禅与计算机程序设计艺术的博客在这篇论文中，作者提出了一个基于动态编程的元学习方法——Dynamic Program Prior (DPP)，用于降低元学习过程中的重复计算量。DPP通过建立一个动态规划模型来预测参数之间的关系并根据该模型进行模型更新，从而...
深入理解计算机视觉中的损失函数
2022-03-27 20:23

Tom Hardy的博客在小样本学习的实际操作中，我们可以使用元学习训练一个模型的初始化参数（MAML），或是一个分类器参数的生成网络（LEO）等等。通过元学习得到的知识，就构成了一种学习方法的先验知识，在预训练的网络之上，进一步...
对元学习的相关研究成果做一个总结和综述，以期为学术界提供更系统、全面、深入的认识 A Survey of MetaLearning Algorithms Survey Paper
2023-08-05 01:39

禅与计算机程序设计艺术的博客 MAML是一个迭代算法，它可以有效训练深度模型，并对数据分布不均衡进行适应。 MAML的基本思想是：每次迭代的时候，基于单个任务的训练数据，利用梯度下降算法来更新模型参数。在每一次迭代过程中，元学习算法会在...
计算机视觉中的小样本学习综述
2021-06-11 00:32

3Ｄ视觉工坊的博客 Few-Shot图像分类算法在本节中，我们将介绍：模型不可知元学习 (Model-Agnostic Meta-Learning, MAML) 匹配网络Matching Networks 原型网络Prototypical Networks 关系网络Relation Networks 模型不可知元学习 ...
三大视角，聊聊我眼中的广告系统
2021-09-06 11:05

kaiyuan_sjtu的博客作者|wulc整理|NewBeeNLP从实习到工作，接触过一些大大小小的广告系统，有麻雀虽小但五脏俱全的小 dsp，也有把 ssp、adx、dsp 都打包了的大媒体，算是对业界...
听听阿里老哥对算法工程师技术学习路线的建议
2020-09-23 11:50

深度学习技术前沿的博客 编程语言-Scala/Java Java目前是企业级开发中最常用的软件，包括在大数据领域，也是应用最广泛的语言，例如当年的Hadoop生态基本都是基于Java开发的。Scala由于其函数式编程的特性，在做数据处理方面提供了非常方便...
基于协同团队的研发模式:如何能够提升协同效率、降低沟通成本?
2023-08-06 02:27

禅与计算机程序设计艺术的博客文本分析：文本分析（Text Analysis）是指对文本进行分析、理解、处理和提取信息的自然语言处理技术。常用算法有词频统计、文档聚类、主题模型、情感分析等。 a) 词频统计：词频统计（Term Frequency）是指对文本的...
【总结】为什么对累积奖励减去baseline项能起到减小方差的作用？
2021-08-24 08:26

深度强化学习实验室的博客写在前面：符号约定在强化学习的policy gradient中，通常会通过环境仿真出一系列的trajectories，以起到类似于对某种概率分布进行采样的作用，某个以时刻T为结束时刻的trajectory可以约定如下：其中分别代表状态...
重磅！2020 年算法工程师技术路线图
2021-06-23 18:28

Tom Hardy的博客工程基础 1）编程语言 Python Python是算法工程师日常工作中最常用的语言，应该作为必须掌握的一门技术。大致的学习路线如下：学习掌握Python的基本语法，可以通过各类入门教程来看，个人推荐《Learn Python the ...
解密Google Cloud 全新 PaLM2及创新应用
2024-03-24 15:50

周一同学Zelina的博客下面先来说说，我们在用大语言模型可以干些什么。最后，我们来说下提示词从哪里开始呢？分成五步：如何开始呢？—— 比如说，拿到，基于PaLm2的这个模型，我们就先一点点地去设计这个提示词。精确—— 可以让它去...
算法工程师之超实用技术路线图
2020-09-02 08:30

Sim1480的博客对于不同级别的算法工程师技能要求，我们大致可以分成以下几个层级：初级：可以在一些指导和协助下独立完成开发任务。具体到算法方面，需要你对于工具框架，建模技术，业务特性等方面有一定的了解，可...
NLP之GPT-3：《 Language Models are Few-Shot Learners》的翻译与解读
2020-07-29 22:37

一个处女座的程序猿的博客最近的研究表明，通过对大量文本语料库进行预训练，然后对特定任务进行微调，在许多NLP任务和基准上取得了实质性的进展。虽然在体系结构中通常与任务无关，但这种方法仍然需要成千上万个示例的特定于任务的微调数据...
一文解读元学习研究进展
2021-09-27 19:05

zenRRan的博客而元学习提供了另一种范例，它有望将神经网络中各种选择的tradeoff、组合设计自动化，成为提升深度学习整体效能的重要推动力，通过更有效地利用数据，利用先验知识迁移并实现无监督和自我指导的学习。 1.1 什么是元...
【Mava】一个分布式多智能体强化学习研究框架
2021-07-30 08:03

深度强化学习实验室的博客 Mava 为 MARL 提供了有用的组件、抽象、实用程序和工具，并允许对多进程系统训练和执行进行简单的扩展，同时提供高度的灵活性和可组合性。注意：我们发布 Mava 的首要目的是使更广泛的社区受益，并使研究人员更...
【ICML2021】 9篇RL论文作者汪昭然：构建“元宇宙”和理论基础，让深度强化学习从虚拟走进现实...
2021-07-13 08:48

深度强化学习实验室的博客汪昭然的本科就读于清华大学电子工程系，是南方某省市的理科市状元，但他不愿意谈论与状元有关的事情：“这个不用写，如果考得不好，那可能就进不了清华电子系了呀。” 接着，他又强调了一遍：“我的长期研究目标...
知乎高赞：算法工程师技术路线图
2020-12-21 11:30

吴师兄学算法的博客来自：知乎，作者：字节链接：https://zhuanlan.zhihu.com/p/192633890这是一份写给公司算法组同事们的技术路线图，其目的主要是为大家在技术路线的成长方面提...
玩PyTorch？你不得不看的PyTorch资源大列表
2020-02-29 18:16

BoCong-Deng的博客写在前面强烈安利，拿走不谢，顺手留个关注和点个赞，嘿嘿嘿 PyTorch我就不多说了吧，我搞CV平时也就用PyTorch和TensorFlow，不过最近更喜欢用PyTorch 了，因为TensorFlow的API真的搞的我头疼，不过因为我有时候用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月23日

悬赏问题

¥100 iOS开发关于快捷指令截屏后如何将截屏(或从截屏中提取出的文本)回传给本应用并打开指定页面
¥15 unity连接Sqlserver
¥15 图中这种约束条件lingo该怎么表示出来
¥15 VSCode里的Prettier如何实现等式赋值后的对齐效果？
¥15 流式socket文件传输答疑
¥20 keepalive配置业务服务双机单活的方法。业务服务一定是要双机单活的方式
¥50 关于多次提交POST数据后，无法获取到POST数据参数的问题
¥15 win10，这种情况怎么办
¥15 如何在配置使用Prettier的VSCode中通过Better Align插件来对齐等式？（相关搜索：格式化）
¥100 在连接内网VPN时，如何同时保持互联网连接

MAML写的对不对，望指导

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新