tensorflow官网照抄代码正确率过低

问题遇到的现象和发生背景

我在tensorflow官网看到的一个代码，原版照抄下来之后，训练正确率只有0.1677

用代码块功能插入代码，请勿粘贴截图。不用代码块回答率下降 50%

import keras
import tensorflow as tf
import numpy as np
from keras.layers import TextVectorization
import string
import re

batch_size = 32
raw_train_ds = tf.keras.preprocessing.text_dataset_from_directory(
    "aclImdb/train",
    batch_size=batch_size,
    validation_split=0.2,
    subset="training",
    seed=1337,
)
raw_val_ds = tf.keras.preprocessing.text_dataset_from_directory(
    "aclImdb/train",
    batch_size=batch_size,
    validation_split=0.2,
    subset="validation",
    seed=1337,
)
raw_test_ds = tf.keras.preprocessing.text_dataset_from_directory(
    "aclImdb/test", batch_size=batch_size
)

print(f"Number of batches in raw_train_ds: {raw_train_ds.cardinality()}")
print(f"Number of batches in raw_val_ds: {raw_val_ds.cardinality()}")
print(f"Number of batches in raw_test_ds: {raw_test_ds.cardinality()}")

def custom_standardization(input_data):
    lowercase = tf.strings.lower(input_data)
    stripped_html = tf.strings.regex_replace(lowercase,'<bar />',' ')
    '''
        string.punctuation = r"""!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~"""
        regex_replace的第二个位置可以填入字符串或标量字符串‘tensor’，要使用的正则表达式
    '''
    return tf.strings.regex_replace(stripped_html,f'[{re.escape(string.punctuation)}]','')


max_features = 20000
embedding_dim = 128
sequence_length = 500

vectorize_layer = TextVectorization(
    standardize=custom_standardization,
    max_tokens=max_features,
    output_mode='int',
    output_sequence_length=sequence_length,
)

text_ds = raw_train_ds.map(lambda x, y:x)
vectorize_layer.adapt(text_ds)

def vectorize_text(text,label):
    text = tf.expand_dims(text,-1)
    return vectorize_layer(text),label

train_ds = raw_train_ds.map(vectorize_text)
val_ds = raw_val_ds.map(vectorize_text)
test_ds = raw_test_ds.map(vectorize_text)

#Do async prefetching / buffering of the data for best performance on GPU
train_ds = train_ds.cache().prefetch(buffer_size = 10)
val_ds = val_ds.cache().prefetch(buffer_size = 10)
test_ds = test_ds.cache().prefetch(buffer_size = 10)

"""
    build a model
"""
from keras import layers
inputs = keras.Input(shape=(None,),dtype='int64')

x = layers.Embedding(max_features,embedding_dim)(inputs)
x = layers.Dropout(0.5)(x)

x = layers.Conv1D(128,7,padding='valid',activation='relu',strides=3)(x)
x = layers.Conv1D(128,7,padding='valid',activation='relu',strides=3)(x)
x = layers.GlobalMaxPool1D()(x)

x = layers.Dense(128,activation='relu')(x)
x = layers.Dropout(0.5)(x)

predictions = layers.Dense(1,activation='sigmoid',name='predictions')(x)

model = keras.Model(inputs,predictions)

model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])

epochs = 3
model.fit(train_ds,validation_data=val_ds,epochs=epochs)

运行结果及详细报错内容

1875/1875 - 30s 13ms/step - loss: -287010357248.0000 - accuracy: 0.1665 - val_loss: -1532206383104.0000 - val_accuracy: 0.1677
Epoch 2/3
1875/1875 - 14s 8ms/step - loss: -10998242082816.0000 - accuracy: 0.1664 - val_loss: -27677966729216.0000 - val_accuracy: 0.1677
Epoch 3/3
1875/1875 - 14s 7ms/step - loss: -73722828423168.0000 - accuracy: 0.1664 - val_loss: -134023263289344.0000 - val_accuracy: 0.1677

我的解答思路和尝试过的方法，不写自己思路的，回答率下降 60%

原版照抄官网，之前一段时间我也遇到过这样的问题，当时的正确率也是这个数字。附一下源代码链接：[https://keras.io/examples/nlp/text_classification_from_scratch/](Text classification from scratch)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
|__WhoAmI__| 2022-12-17 16:21
关注
可能的原因：

1、使用的数据集是 IMDB 电影评论数据集，它是一个二分类问题，而你的模型输出层是一个单神经元输出层，因此可能会导致正确率较低。可以在输出层使用 sigmoid 激活函数，并使用二元交叉熵损失函数来解决这个问题。

2、你的模型可能缺少足够的深度和宽度，因此无法对数据进行足够的拟合。可以尝试增加模型的层数，或者增加每层的神经元数量来解决这个问题。

3、可能没有足够的训练数据。深度学习模型通常需要大量的数据来进行训练，如果的数据量较少，可能会导致正确率较低。可以尝试扩充数据集或使用数据增强来解决这个问题。

4、你的模型可能存在过拟合问题。过拟合意味着模型在训练集上的表现很好，但是在测试集上的表现较差。可以尝试使用正则化技术（如 Dropout）或使用早停法来解决这个问题。

5、你的模型可能受到超参数的影响。超参数是指模型的设置（如学习率，优化器类型等），它们可以影响模型的训练过程和最终的性能。可以尝试调整超参数来提高模型的正确率。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

TensorFlow高层封装：从入门到喷这本书
2019-05-08 11:11

weixin_30951389的博客目录 TensorFlow高层封装：从入门到喷这本书 0. 写在前面 1. TensorFlow高层封装总览 2. Keras介绍 2.1 Keras基本用法 2.2 Keras高级用法 3. Estimator介绍 ...
888租房推荐系统(需求文档)
2025-10-18 10:43

虎哥计算机毕设的博客在技术方面，可以使用Python作为后端编程语言，结合Django框架来实现高效的数据处理和逻辑处理。对于数据存储和处理，我们可以选择使用关系型数据库（如MySQL）或非关系型数据库（如MongoDB）来满足不同的需求。...
入门深度学习：先学Python还是先学原理？优先级排序+8周落地计划（2026实战版）
2025-12-19 10:36

AI规划师-南木的博客其实，深度学习的学习没有绝对“正确”的顺序，只有“适合”的顺序，而最适合新手的顺序就是“工具优先，原理并行，项目驱动”。不要追求“完美顺序”，先开始比什么都重要；工具是用来“落地”的，原理是用来“提升...
计算机专业毕业设计全流程保姆级指南｜从选题到答辩，一次过拿高分！
2026-03-12 00:41

晴天毕设工作室～的博客别再觉得毕设只是 “为了拿毕业证”，它的价值远超你的想象：学术价值：综合应用编程语言、框架、数据库、软件工程等专业知识，检验四年学习成果，形成系统化的技术思维；职业价值：打造属于自己的可演示、可讲解...
阅读笔记--NLP面试基础知识总结
2021-01-02 10:53

HAH-M的博客而负采样只挑选部分权重做小范围更新解释二：负采样主要解决的问题就是参数量过大，模型很难训练的问题。那么什么是负采样中的正例和负例？如果 vocabulary 大小为1万时，当输入样本 ( “fox”, “quick”) 到...
PaddlePaddle官方文档阅读指南：新手如何快速上手？
2025-12-26 06:51

綾音Ayane的博客针对中文开发者，PaddlePaddle凭借对中文NLP和国产硬件的深度支持，成为易上手且高效部署...本文引导新手通过官方文档的快速开始、典型案例与镜像环境，避开配置坑，快速跑通OCR等实战项目，实现从零到上线的平滑过渡。
端侧AI部署小白入门超级清单：RKNN开发从0到1
2026-01-06 20:52

技术摆渡人的博客 VS Code（代码编辑器）定义：微软开发的强大代码编辑器，支持远程调试作用：写Python、C++代码，调试模型转换和推理为什么重要：没有趁手的编辑器，开发效率低50% 小白技巧：装上Python插件和Remote-SSH插件，就...
用基础模型构建应用（第八章）AI Engineering: Building Applications with Foundation Models学习笔记
2025-07-08 23:03

让我看看好学吗的博客多编程语言应用需覆盖目标语言集。提升语言模型性能的关键：数据质量与多样性。但“数据增加困境”研究指出，过多异质数据有时会导致性能下降。 2. 训练阶段的覆盖策略（与 Llama 3 为例）相比于旧版 Llama，Llama...
TensorFlow 2.0 GPU加速安装与多卡训练配置
2025-12-26 14:34

青妍的博客本文详细讲解如何为TensorFlow 2.0配置GPU环境，包括NVIDIA驱动、CUDA 10.0与cuDNN的安装步骤及版本对应关系。通过pip安装tensorflow-gpu后，可使用device_lib查看可用GPU，并通过CUDA_VISIBLE_DEVICES指定使用显卡...
把模型放上板：边缘 AI 的任务画像与可行性边界（MCU/NPU 实战视角）
2025-09-14 09:11

观熵的博客边缘侧能不能跑 AI，不取决于“能不能训练”，而取决于**任务画像**与**资源预算**是否被老老实实地做过：输入速率与分辨率、前处理算子链、网络 MACs/参数量、峰值激活内存、端到端时延、功耗与温升。这篇文章给出...
ARM杂谈
2018-01-11 12:27

李九阳的博客别小看这百分之几十，对晶体管来说，面积就是成本，晶圆的总面积一定，价钱一定，那单颗芯片的面积越小，成本越低，并且此时良率也越高。芯片成本除了流片，晶圆和封测费，还来自于授权费，工具费，运营开销等...
Triton server的部署、构建、backend插件机制代码梳理、模型加载、自定义C++backend流程
2025-06-12 11:27

cumtchw的博客 Triton inference server的部署、构建、backend机制代码详细梳理、模型加载过程、自定义C++backend流程.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月17日