ValueError: 添加到顺序模型的所有层都应具有唯一的名称

在训练一个用于音乐生成的VAE模型时，遇到报错：

ValueError       Traceback (most recent call last)
/tmp/ipykernel_27/1449102967.py in <module>
     98 
     99 random_vector_for_generation = tf.random.normal(shape = [num_examples_to_generate, latent_dim])
--> 100 model = CVAE(latent_dim)

/tmp/ipykernel_27/1449102967.py in __init__(self, latent_dim)
     52 
     53                 layers.Flatten(name = 'flatten'),
---> 54                 layers.Dense(latent_dim + latent_dim, name = 'dense'),
     55             ]
     56         )
...

报错：

All layers added to a Sequential model should have unique names. Name "" is already the name of a layer in this model. Update the name argument to pass a unique name.

python version：3.7
tensorflow version：2.3

class Resnet1DBlock(tf.keras.Model):
    def __init__(self, kernel_size, filters, type = 'encode', prefix = ''):
        super(Resnet1DBlock, self).__init__(name = '')
    
        if type == 'encode':
            self.conv1a = layers.Conv1D(filters, kernel_size, 2, padding = "same", \
                                        name = prefix + 'conv1a')
            self.conv1b = layers.Conv1D(filters, kernel_size, 1, padding = "same", \
                                        name = prefix + 'conv1b')
            self.norm1a = tfa.layers.InstanceNormalization(name =  prefix + 'norm1a')
            self.norm1b = tfa.layers.InstanceNormalization(name =  prefix + 'norm1b')
        elif type == 'decode':
            self.conv1a = layers.Conv1DTranspose(filters, kernel_size, 1, padding = "same", \
                                                name =  prefix + 'conv1a')
            self.conv1b = layers.Conv1DTranspose(filters, kernel_size, 1, padding = "same", \
                                                name =  prefix + 'conv1b')
            self.norm1a = tf.keras.layers.BatchNormalization(name =  prefix + 'norm1a')
            self.norm1b = tf.keras.layers.BatchNormalization(name =  prefix + 'norm1b')
        else:
            return None

    def call(self, input_tensor):
        x = tf.nn.relu(input_tensor)
        x = self.conv1a(x)
        x = self.norm1a(x)
        x = layers.LeakyReLU(0.4)(x)

        x = self.conv1b(x)
        x = self.norm1b(x)
        x = layers.LeakyReLU(0.4)(x)

        x += input_tensor
        return tf.nn.relu(x)
    
class CVAE(tf.keras.Model):

    def __init__(self, latent_dim):
        super(CVAE, self).__init__()
        self.latent_dim = latent_dim
        self.encoder = tf.keras.Sequential(
            [
                tf.keras.layers.InputLayer(input_shape = (1, 90001), name = 'input_encoder'),

                layers.Conv1D(64, 1, 2, name = 'conv1_layer1'),
                Resnet1DBlock(64, 1, 'encode', prefix = 'res1_'),
                layers.Conv1D(128, 1, 2, name = 'conv1_layer2'),
                Resnet1DBlock(128, 1, 'encode', prefix = 'res2_'),
                layers.Conv1D(128, 1, 2, name = 'conv1_layer3'),
                Resnet1DBlock(128, 1, 'encode', prefix = 'res3_'),
                layers.Conv1D(256, 1, 2, name = 'conv1_layer4'),
                Resnet1DBlock(256, 1, 'encode', prefix = 'res4_'),

                layers.Flatten(name = 'flatten'),
                layers.Dense(latent_dim + latent_dim, name = 'dense'),
            ]
        )
        self.decoder = tf.keras.Sequential(
            [
                tf.keras.layers.InputLayer(input_shape = (latent_dim,), name = 'input_decoder'),
                layers.Reshape(target_shape = (1, latent_dim)),
                Resnet1DBlock(512, 1, 'decode', prefix = 'res1_'),
                layers.Conv1DTranspose(512, 1, 1, name = 'Conv1Trans_Layer1'),
                Resnet1DBlock(256, 1, 'decode', prefix = 'res2_'),
                layers.Conv1DTranspose(256, 1, 1, name = 'Conv1Trans_Layer2'),
                Resnet1DBlock(128, 1, 'decode', prefix = 'res3_'),
                layers.Conv1DTranspose(128, 1, 1, name = 'Conv1Trans_Layer3'),
                Resnet1DBlock(64, 1, 'decode', prefix = 'res4_'),
                layers.Conv1DTranspose(64, 1, 1, name = 'Conv1Trans_Layer4'),
                layers.Conv1DTranspose(90001, 1, 1, name = 'Conv1Trans_Layer5')
            ]
        )
        
# 省略了与报错无关的函数
optimizer = tf.keras.optimizers.Adam(0.0003, beta_1 = 0.9, beta_2 = 0.999, epsilon = 1e-08)

random_vector_for_generation = tf.random.normal(shape = [num_examples_to_generate, latent_dim])
model = CVAE(latent_dim)

我非常疑惑，明明已经给所有网络层命名了。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-04-23 18:06

关注

你可以参考下这篇文章：tensorflow+Python ValueError以及解决方法（后续继续更新）
除此之外, 这篇博客: tensorflow2.1.0——如何构建网络(三)中的 3. 以VAE为例，讲解如何解决这些问题 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

首先，我们要思考如何选择网络的构建方式，本质上就是要考虑从损失函数好计算的角度来选择网络构建的方式，下面代码的注释会详细介绍。
①考虑使用一个Squential去构建encoder和decoder，这是完全不可行的。一个致命的问题就是无法计算损失函数。其次，也无法单独使用生成器来生成图片。

# 考虑使用一个Squential构建VAE
model = tf.keras.Squential([
encoder,   #伪代码，encoder为神经网络,里边的层请自己脑补
lambda层/自定义层,  # 重采样层
decoder  # decoder神经网络
])

至此，网络结构搭好了。但正如上述所说，loss如何计算呢？
因为keras.losses库中并没有为VAE准备损失，所以我们肯定考虑我们自己搞一个损失函数就得了，好，那进入下一个问题:
损失函数有哪些？
重构误差 + KL(q(z|x)||p(z))
重构误差：使用交叉熵损失函数，需要y_true,y_pred.
我们可以定义一个函数去计算loss，包括重构误差和KL散度,**重点看一下KL散度**
def compute_loss(model,x):
	"""
	x:真实的图片
	model：我们的模型
	"""
	# 当decoder最后一层没有使用激活函数时，from_logits置为True，保证数据的稳定性。
	cross_entropy = tf.keras.losses.BinaryCrossEntropy(from_logit=True)
	out = model(x)
	rec_loss = cross_entropy(y_true=x,y_pred=out)
	
	# 那么KL散度如何计算，我们得不到encoder的均值和方差，咋弄？
	
可以看到，构建方式的选择将会影响我们能否计算loss。
至此，我们决定放弃第一期讲的构建网络的方式！

②考虑第二期介绍的构建网络的方式：Input与output

我们在第二期也讲了，通过Input与output构建，增加了构建网络的灵活性，所以，这种方式肯定是可以的。下面直接上代码

# 定义自己的模型
latent_dimension = 50
# 重采样函数，应用在Lambda层
def sampling(agrs):
    mean,logvar = agrs[0],agrs[1]
    eps = tf.random.normal(tf.shape(mean))
    
    return mean + eps*tf.exp(logvar * 0.5)


# 编码阶段
    
x = layers.Input(shape=(784,)) 
    
h1 = layers.Dense(200,activation='softplus')(x)
h2 = layers.Dense(200,activation='softplus')(h1)
# 均值和方差层不需要激活函数
mean = layers.Dense(latent_dimension)(h2)
log_var = layers.Dense(latent_dimension)(h2)
    
# 将采样过程看成一个Lambda层
z = layers.Lambda(sampling,output_shape=(latent_dimension,))([mean,log_var])
    
# 解码阶段
h3 = layers.Dense(200,activation='softplus')
h4 = layers.Dense(200,activation='softplus')
h5 = layers.Dense(200,activation='softplus')
# No activation
end = layers.Dense(784)
z1 = h3(z)
z2 = h4(z1)
z3 = h5(z2)
out = end(z3)
    
# 建立模型
model = tf.keras.Model(x,out)
    
cross_ent = tf.reduce_sum(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.split(x,num_or_size_splits=2,axis=-1)[0],logits=out),axis=-1) # 重构误差
KL = -tf.reduce_sum(1+log_var-tf.square(mean)-tf.exp(log_var),axis=-1)
dvae_loss = tf.reduce_mean(cross_ent + KL)
model.add_loss(dvae_loss)

# 编译
model.compile(optimizer='adam')
# fit
history = model.fit(train_dataset,epochs=80,validation_data=test_dataset) 


# 在训练好模型后，我们肯定是要从生成器中生成模型，这很方便

# 构造生成器
decoder_input = layers.Input(shape=(latent_dimension,))
h1_decoder = h3(decoder_input) #200，h3层的参数在之前就训练好了
h2_decoder = h4(h1_decoder)    #200
h3_decoder = h5(h2_decoder)    #200
decoder_output = end(h3_decoder) 

generator = tf.keras.Model(decoder_input,decoder_output)

报告相同问题？

关注问题

编程语言发展史之：编程语言设计原则
2023-10-15 00:47

光子AI的博客从技术的角度看，计算机的发展史可...而在计算机发展的后半段，个人计算机逐渐成为主要的个人用计算设备，因而出现了各种编程语言的出现。编程语言是一种用来表达计算思维的方式，其本质就是人与机器之间沟通的工具。
Python编程语言进阶：掌握Python的数据结构与算法
2023-08-07 00:35

光子AI的博客 Python是一门能够简单易懂并且功能强大的编程语言。作为一名数据科学家或者机器学习工程师，掌握Python的数据结构和算法至关重要。本文旨在系统全面的、充分地讲解和理解Python数据结构与算法知识。包括但不限于数组...
Python异步编程与asyncio：从入门到精通
2025-05-31 18:24

CarlowZJ的博客 Python的异步编程模型通过asyncio库提供了强大的并发处理能力，能够有效提升程序的性能和响应速度。本文将从异步编程的基本概念入手，详细讲解asyncio的使用方法、代码示例、应用场景、注意事项以及与其他异步框架的...
Python中的asyncio：高效的异步编程模型
2025-01-08 12:32

蒙娜丽宁的博客传统的同步编程模型在面对高并发和IO密集型任务时，常常显得捉襟见肘，难以满足现代应用的需求。Python的`asyncio`库作为一种高效的异步编程模型，为开发者提供了强大的工具来优化程序的性能和响应速度。本文深入...
大语言模型实战（十四）——MCP Prompts提示系统深度解析：构建智能提示模板库与LLM集成方案
2026-01-05 23:26

小陈phd的博客 # 【关键】定义提示词模板字典description="分析代码并提供改进建议",description="需要审查的代码",),description="编程语言",),description="审查重点（可选：performance, security, readability）",),...
【LangChain编程：从入门到实践】RunnablePassthrough
2024-06-30 02:45

光子AI的博客【LangChain编程：从入门到实践】RunnablePassthrough 作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM
【大语言模型 35】模型对齐评估：安全性与有用性平衡
2025-08-30 21:08

莫比乌斯@卷的博客本文深入探讨了大语言模型对齐评估的关键挑战：如何在确保模型安全性的同时保持其有用性。文章系统阐述了对齐评估的理论框架、多维度评估指标、安全性与有害性测试方法、有用性评估策略，以及两者之间的权衡机制。...
LangChain大语言模型工作原理(1)
2025-06-22 00:37

Android 小码蜂的博客 LangChain是一个强大的框架，旨在简化大语言模型(LLM)应用的开发过程。它提供了一系列模块化的组件，使开发者能够轻松地构建、连接和部署基于LLM的应用。 LangChain的核心组件包括： - **模型接口**：提供与各种LLM...
Ollama-python：调用大模型服务实现代码自动补全，提升编程开发效率！
2025-05-06 11:06

LLM.的博客大模型部署在本地后，我们可以有哪些应用呢？本文介绍如何通过 Ollama 的 python sdk，调用本地部署的大模型服务，对我们的代码进行自动补全，提升日常的编程开发效率。
深度体验Ling Studio：万亿参数模型如何重塑AI开发工作流
2026-02-22 10:21

一键难忘的博客百灵大模型发布万亿参数混合线性架构Ling2.5，其核心产品LingStudio为开发者提供智能编程体验。Ling2.5采用混合线性注意力体系，结合MLA和LightningLinearAttention技术，显著提升长序列推理效率。LingStudio具备三...
Transformer Networks: Transformer模型的一些关键要素和应用
2023-07-28 00:49

光子AI的博客 2017年，在深度学习领域中最火热的框架之一——TensorFlow被提出，其出现改变了神经网络模型的构建方式。随后基于Transformer模型的BERT、GPT-2等变体在NLP任务上获得了一系列的成就。那么，什么是Transformer?它又...
模型压缩方法对比：低秩矩阵分解(LMM)与约束压缩(COC)
2023-08-13 01:01

光子AI的博客模型压缩（model compression）是通过减少模型参数、模型大小或者权重等方式，来降低计算复杂度，提升模型效率的方法。...并基于不同的场景，结合数学、Python、PyTorch等编程语言和工具，进行实验验证和分析。
实现高效生成式预训练Transformer模型：基于多模态数据融合和多任务学习的方法
2023-07-28 00:55

光子AI的博客传统Transformer模型基于字符级别或者词级的文本，通常只进行了几层网络结构，而在实际生产环境中，任务不同，输入类型也不同，比如序列标注、序列生成等，会遇到不同的输入数据形式。因此，提出了用统一的预训练...
Python编程入门：本文以实际案例的方式，带您快速入门Python编程，掌握Python编程技巧
2023-08-09 03:42

光子AI的博客 1991年，Guido van Rossum编写了Python语言，这个语言诞生于一个开源社区中。Python是一个易学习的、功能强大的编程语言，可以实现多种领域的应用，如机器学习、web开发、数据分析、图像处理等。Python是一种高层次...
AutoGen 技术博客系列九：从 v0.2 到 v0.4 的迁移指南
2025-02-22 21:08

人肉推土机的博客这是一份为 `autogen-agentchat` `v0.2.*` 版本用户提供的迁移指南，旨在帮助用户升级到 `v0.4` 版本，该版本引入了一组新的 API 和功能。`v0.4` 版本包含重大变更，请仔细阅读本指南。我们仍在 `0.2` 分支...
短期内快速掌握Python编程基础
2025-04-04 22:31

张彦峰ZYF的博客内容涵盖运行环境、基础语法、控制流、函数、字符串处理以及列表、字典、集合等常用数据结构，并结合可运行示例，帮助读者建立清晰、连贯的语言认知体系。文章不追求速成，而强调理解与动手实践，适合初学者入门，也...
本地部署Qwen2大模型之三：编译CPU版vLLM
2024-12-24 03:13

康顺哥的博客继续探究vLLM方式在本地部署Qwen2大模型的方法，对于未配备GPU的电脑，手动编译并安装CPU版的vLLM。
SCRFD算法实战：从环境搭建到模型训练全流程解析
2025-10-18 04:10

purple的博客本文详细解析了SCRFD人脸检测算法从零开始的全流程实战，重点涵盖...通过手把手的教程，指导读者完成环境配置、数据准备、模型训练与评估，最终实现模型导出与部署，帮助开发者快速掌握并应用这一高效的人脸检测技术。
Triton语言系统架构：从Python到PTX代码的编译流水线
2025-10-16 22:25

九章云极AladdinEdu的博客本文深入解析了Triton语言从高级Python代码到底层PTX指令的完整编译流水线。通过系统分析Triton的AST变换、内存层次规划与线程调度优化等核心机制，揭示了其如何实现兼顾编程便利性与硬件效率的独特设计哲学。文章还...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月23日

ValueError: 添加到顺序模型的所有层都应具有唯一的名称

2条回答 默认 最新

问题事件

2条回答默认最新