Mac m1安装Tensorflow-metal导致模型准确率降低

如题，在M1 Mac上使用tensorflow跑vgg网络，正常时准确率不断上升，经过5个epoch后为0.7315，但是速度很慢。在安装了tensorflow-metal进行硬件加速后，时间大幅缩短，但是准确率一直维持在0.1左右，几乎与乱选准确率相同。
代码为北大tensorflow笔记公开课CNN部分，数据集为cifar10，具体代码如下：

import tensorflow as tf
import os
import numpy as np
from matplotlib import pyplot as plt
from tensorflow.keras.layers import Conv2D, BatchNormalization, Activation, MaxPool2D, Dropout, Flatten, Dense
from tensorflow.keras import Model

np.set_printoptions(threshold=np.inf)

cifar10 = tf.keras.datasets.cifar10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0


class VGG16(Model):
    def __init__(self):
        super(VGG16, self).__init__()
        self.c1 = Conv2D(filters=64, kernel_size=(3, 3), padding='same')  # 卷积层1
        self.b1 = BatchNormalization()  # BN层1
        self.a1 = Activation('relu')  # 激活层1
        self.c2 = Conv2D(filters=64, kernel_size=(3, 3), padding='same', )
        self.b2 = BatchNormalization()  # BN层1
        self.a2 = Activation('relu')  # 激活层1
        self.p1 = MaxPool2D(pool_size=(2, 2), strides=2, padding='same')
        self.d1 = Dropout(0.2)  # dropout层

        self.c3 = Conv2D(filters=128, kernel_size=(3, 3), padding='same')
        self.b3 = BatchNormalization()  # BN层1
        self.a3 = Activation('relu')  # 激活层1
        self.c4 = Conv2D(filters=128, kernel_size=(3, 3), padding='same')
        self.b4 = BatchNormalization()  # BN层1
        self.a4 = Activation('relu')  # 激活层1
        self.p2 = MaxPool2D(pool_size=(2, 2), strides=2, padding='same')
        self.d2 = Dropout(0.2)  # dropout层

        self.c5 = Conv2D(filters=256, kernel_size=(3, 3), padding='same')
        self.b5 = BatchNormalization()  # BN层1
        self.a5 = Activation('relu')  # 激活层1
        self.c6 = Conv2D(filters=256, kernel_size=(3, 3), padding='same')
        self.b6 = BatchNormalization()  # BN层1
        self.a6 = Activation('relu')  # 激活层1
        self.c7 = Conv2D(filters=256, kernel_size=(3, 3), padding='same')
        self.b7 = BatchNormalization()
        self.a7 = Activation('relu')
        self.p3 = MaxPool2D(pool_size=(2, 2), strides=2, padding='same')
        self.d3 = Dropout(0.2)

        self.c8 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b8 = BatchNormalization()  # BN层1
        self.a8 = Activation('relu')  # 激活层1
        self.c9 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b9 = BatchNormalization()  # BN层1
        self.a9 = Activation('relu')  # 激活层1
        self.c10 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b10 = BatchNormalization()
        self.a10 = Activation('relu')
        self.p4 = MaxPool2D(pool_size=(2, 2), strides=2, padding='same')
        self.d4 = Dropout(0.2)

        self.c11 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b11 = BatchNormalization()  # BN层1
        self.a11 = Activation('relu')  # 激活层1
        self.c12 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b12 = BatchNormalization()  # BN层1
        self.a12 = Activation('relu')  # 激活层1
        self.c13 = Conv2D(filters=512, kernel_size=(3, 3), padding='same')
        self.b13 = BatchNormalization()
        self.a13 = Activation('relu')
        self.p5 = MaxPool2D(pool_size=(2, 2), strides=2, padding='same')
        self.d5 = Dropout(0.2)

        self.flatten = Flatten()
        self.f1 = Dense(512, activation='relu')
        self.d6 = Dropout(0.2)
        self.f2 = Dense(512, activation='relu')
        self.d7 = Dropout(0.2)
        self.f3 = Dense(10, activation='softmax')

    def call(self, x):
        x = self.c1(x)
        x = self.b1(x)
        x = self.a1(x)
        x = self.c2(x)
        x = self.b2(x)
        x = self.a2(x)
        x = self.p1(x)
        x = self.d1(x)

        x = self.c3(x)
        x = self.b3(x)
        x = self.a3(x)
        x = self.c4(x)
        x = self.b4(x)
        x = self.a4(x)
        x = self.p2(x)
        x = self.d2(x)

        x = self.c5(x)
        x = self.b5(x)
        x = self.a5(x)
        x = self.c6(x)
        x = self.b6(x)
        x = self.a6(x)
        x = self.c7(x)
        x = self.b7(x)
        x = self.a7(x)
        x = self.p3(x)
        x = self.d3(x)

        x = self.c8(x)
        x = self.b8(x)
        x = self.a8(x)
        x = self.c9(x)
        x = self.b9(x)
        x = self.a9(x)
        x = self.c10(x)
        x = self.b10(x)
        x = self.a10(x)
        x = self.p4(x)
        x = self.d4(x)

        x = self.c11(x)
        x = self.b11(x)
        x = self.a11(x)
        x = self.c12(x)
        x = self.b12(x)
        x = self.a12(x)
        x = self.c13(x)
        x = self.b13(x)
        x = self.a13(x)
        x = self.p5(x)
        x = self.d5(x)

        x = self.flatten(x)
        x = self.f1(x)
        x = self.d6(x)
        x = self.f2(x)
        x = self.d7(x)
        y = self.f3(x)
        return y


model = VGG16()

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['sparse_categorical_accuracy'])

checkpoint_save_path = "./checkpoint/VGG16.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('-------------load the model-----------------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_save_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)

history = model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1,
                    callbacks=[cp_callback])
model.summary()

# print(model.trainable_variables)
file = open('./weights.txt', 'w')
for v in model.trainable_variables:
    file.write(str(v.name) + '\n')
    file.write(str(v.shape) + '\n')
    file.write(str(v.numpy()) + '\n')
file.close()

###############################################    show   ###############################################

# 显示训练集和验证集的acc和loss曲线
acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.legend()
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
源码时代网 2023-07-23 19:18
关注
确实有一些用户报告在使用Apple M1芯片的Mac上安装TensorFlow Metal后，模型的准确率下降的问题。这可能是由于TensorFlow Metal在当前版本下仍然处于早期阶段，并且可能存在一些尚未解决的问题。

有几个可能的解决方法可以尝试：

使用Rosetta 2模拟器：将TensorFlow回退到Intel架构版本，并通过Rosetta 2模拟器在M1芯片上运行。这可能可以避免性能和准确率下降的问题，但可能会牺牲一些性能。

等待更新版本：TensorFlow和TensorFlow Metal的开发人员正在积极工作，以改进和优化在M1芯片上的性能和兼容性。随着时间的推移，新的更新版本可能会提供更好的准确率和性能。

尝试其他框架：如果您是使用Mac上的深度学习框架，可以尝试使用其他支持M1芯片的框架，例如PyTorch或Apple自家的Core ML框架。这些框架可能在M1芯片上提供更好的性能和准确率。

请记住，M1芯片是相对较新的技术，尽管TensorFlow Metal已经发布，但在其上运行的框架和工具仍然在发展中。随着时间的推移，更多的优化和改进将使得在M1芯片上的机器学习任务更加稳定和可靠。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Mac m1 安装centos-7 linux
2022-02-26 16:55

回答 1 已采纳因为你用错镜像了,m1芯片是arm架构的,所以要用arm的版本 htt
MAC M1芯片tensorflow下的fit报错Graph execution error: tensorflow 深度学习神经网络
2023-01-09 21:30

回答 5 已采纳版本不匹配要降级pip install tensorflow-metal==0.5.0pip install tensorflow-macos==2.9.0
MacBook M1安装jdk失败 java macos
2022-01-05 19:46

回答 3 已采纳 “-”后面多了一个空格导致，系统识别成你在使用java命令对 “-”进行操作，显然是没有这个命令的，所以保错了去掉空格试试 java -version
深度学习代码实践（三）5行代码创建手写数字体识别的Tensorflow模型
2021-11-07 16:05

davidullua的博客场景：对包含单个数字的图片进行识别，识别出图片中的数字训练数据：采用 mnist 数据集中的 60000...以下代码先加载 mnist 的图片数据集，然后构建模型进行训练，评估模型，图形化展示训练集和测试集的损失和准确度
mac m1 怎么安装red hat8 linux
2022-01-17 12:06

回答 2 已采纳你下载系统镜像文件的时候,注意选择带"ARM"(或者"aarch")标识的版本进行下载,不要下带"x86"的
macbook M1在anaconda中安装pytorch最后一步报错No module named torch python
2022-04-28 19:01

回答 1 已采纳 https://zhuanlan.zhihu.com/p/169919348https://www.freesion.com/article/78491017788/检查环境变量，看看电脑和这个解释器
MacBook M1虚拟机怎么安装CH340驱动？ arm arm开发驱动开发
2021-08-29 08:56

回答 6 已采纳厂家已经支持啦http://www.wch.cn/downloads/CH341SER_ZIP.html
了解 LLMOps、架构模式、如何在本地或云端评估、微调和部署 HuggingFace 生成式 AI 模型。
2024-07-30 18:44

CloseAi论坛的博客奖励模型通常是小型二元分类器，基于较小的语言模型，如。
mac m1安装的ubuntu下如何安装notepad？ c语言改行学IT
2023-02-17 12:28

回答 1 已采纳 Notepad 是一个 Windows 平台下的文本编辑器，不能在 Mac 或 Ubuntu 系统下直接安装。如果你想在 Ubuntu 下使用 Notepad，可以通过使用 Wine 运行 Windo
virtualbox在Mac m1中安装说找不到硬件架构怎么解决啊？ linux 大数据
2022-02-05 21:12

回答 1 已采纳没法解决,virtualbox本就不支持arm架构,而且也没有计划去支持,virtualbox官网关于里说得很清楚了,只针对x86架构
MacBook Air m1 UTM虚拟机安装ARM版win10时出现如下问题 arm 其他嵌入式硬件
2022-05-15 17:15

回答 2 已采纳 Github上的一个ISSURE提到了这个问题解决方法你在使用 macOS 网络共享吗？在这种情况下，请尝试将网络模式更改为Emulated VLAN 以解决此错误。参考链接：
ShowMeAI 人工智能工具笔记（十）
2024-10-16 00:15

绝不原创的飞龙的博客 准确率应该与我们转移过来的原始准确率完全一致。因此，我们基本上完成了迁移学习。我们已经转移了一切。通常这不是你想要做的事情。我们会有一个重复的神经网络，可以分类与原始神经网络相同的三种花，但并不太有用...
macos 使用pycharm安装ta-lib报错 macos pycharm python
2022-02-26 23:43

回答 1 已采纳先安装这个依赖$ brew install ta-lib再重新pip install
ARM杂谈
2018-01-11 12:27

李九阳的博客而它的指令又非常依赖于编译器来优化，当时编译器又没跟上，导致总体性能低下。而MIPS或者PowerPC的处理器频率都不高，但是每赫兹性能相对来说还不错，总体性能就会提高一些。所以性能要看总体跑分，而不是每赫兹...
TowardsDataScience 博客中文翻译 2021（一百一十三）
2024-10-11 00:57

绝不原创的飞龙的博客纯粹从理论上讲，所有自然语言处理(NLP)算法的最终目标都是创造能够理解人类语言的人工智能(AI)，此外，在“实现意义”(文本分析)和“做出有意义的陈述”(文本合成)的意义上“理解”。虽然这个目标仍然非常遥远——...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月23日

悬赏问题

¥15 有人知道怎么在R语言里下载Git上的miceco这个包吗
¥15 GPT写作提示指令词
¥20 如何在cst中建立这种螺旋扇叶结构
¥20 根据动态演化博弈支付矩阵完成复制动态方程求解和演化相图分析等
¥20 关于DAC输出1.000V对分辨率和精度的要求
¥20 想写一个文件管理器，加载全部子文件夹后，要一级一级返回
¥15 华为超融合部署环境下RedHat虚拟机分区扩容问题
¥15 哪位能做百度地图导航触点播报？
¥15 请问GPT语言模型怎么训练？
¥15 已知平面坐标系（非直角坐标系）内三个点的坐标，反求两坐标轴的夹角

Mac m1安装Tensorflow-metal导致模型准确率降低

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新