mobilefacenet

我訓練MobileFaceNet模型時遇到特徵崩潰的問題導致分辨不出人臉，因為要部署在HT32F49395上，所以我有把他轉成INT8，一開始以為是訓練問題有更改過各種參數還是一樣以下是輸出結果

 人數: 3
  向量形狀 (N,D): (3, 64)
INFO: Created TensorFlow Lite XNNPACK delegate for CPU.
TFLite: E:\python\TinyMobileFaceNet\runs\2025-08-20_tmfn\tflite\tmfn_fp16.tflite
  模型輸出維度: 64  dtype: float32
  L2 範數 min/max: 0.9999999403953552 1.0
  維度方差均值: 1.0199328670523755e-07
  兩兩餘弦（非對角） mean/max/min: 0.9999902844429016 0.9999929666519165 0.9999876022338867

這是完整的訓練程式

# train_rescue.py  
import os, random, glob, cv2, numpy as np, argparse
from pathlib import Path
from datetime import datetime
import tensorflow as tf
from tensorflow.keras import layers, models

# ========= 路徑與超參 =========
IMG_SIZE   = 112
EMB_DIM    = 64
DATA_DIR   = Path("data") / "dataset"   
BATCH      = 64                         # P×K：由 P_CLASSES 與 BATCH 推得 K
P_CLASSES  = 16
STEPS_PER_EPOCH = 150
VAL_SPLIT  = 0.15
EPOCHS_A, EPOCHS_B = 15, 70
LR_A, LR_B = 1e-3, 1.25e-4
MARGIN = 0.4

# 解析命令列
ap = argparse.ArgumentParser()
ap.add_argument("--data", type=str)
ap.add_argument("--epA", type=int)
ap.add_argument("--epB", type=int)
ap.add_argument("--lrA", type=float)
ap.add_argument("--lrB", type=float)
ap.add_argument("--margin", type=float)
args, _ = ap.parse_known_args()
if args.data:   DATA_DIR = Path(args.data)
if args.epA:    EPOCHS_A = args.epA
if args.epB:    EPOCHS_B = args.epB
if args.lrA:    LR_A = args.lrA
if args.lrB:    LR_B = args.lrB
if args.margin: MARGIN = args.margin

RUN_DIR    = Path("runs") / (datetime.now().strftime("%Y-%m-%d") + "_tmfn")
MODELS_DIR = RUN_DIR / "models"
LOGS_DIR   = RUN_DIR / "logs"
for d in [MODELS_DIR, LOGS_DIR]: d.mkdir(parents=True, exist_ok=True)
BEST_KERAS = MODELS_DIR / "best.keras"
LAST_KERAS = MODELS_DIR / "last.keras"

# ========= 小工具 =========
def _imread_u(p): return cv2.imdecode(np.fromfile(p, np.uint8), cv2.IMREAD_COLOR)
def _pre_bgr(im, size=IMG_SIZE):
    im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB)
    im = cv2.resize(im, (size, size), interpolation=cv2.INTER_AREA)
    return (im.astype(np.float32)/127.5) - 1.0

def bn_relu(x):
    x = layers.BatchNormalization()(x)
    return layers.ReLU(6.0)(x)

def dw_sep(x, out_ch, stride=1):
    x = layers.DepthwiseConv2D(3, strides=stride, padding="same", use_bias=False)(x); x = bn_relu(x)
    x = layers.Conv2D(out_ch, 1, padding="same", use_bias=False)(x); x = bn_relu(x)
    return x

def tiny_mobilefacenet(input_shape=(IMG_SIZE, IMG_SIZE, 3), emb_dim=EMB_DIM):
    inp = layers.Input(input_shape)
    x = layers.Conv2D(16, 3, strides=2, padding="same", use_bias=False)(inp); x = bn_relu(x)
    x = dw_sep(x, 32, 1)
    x = dw_sep(x, 64, 2)
    x = dw_sep(x, 64, 1)
    x = dw_sep(x, 128, 2)
    x = dw_sep(x, 128, 1)
    x = dw_sep(x, 128, 1)
    x = dw_sep(x, 256, 2)
    x = dw_sep(x, 256, 1)
    x = layers.GlobalAveragePooling2D()(x)
    feat = layers.Dense(emb_dim, use_bias=False, name="feat")(x)        # 未正規化特徵
    emb  = layers.Lambda(lambda t: tf.math.l2_normalize(t, axis=1), name="emb")(feat)  # L2
    return models.Model(inp, [emb, feat], name="TinyMobileFaceNet")

def scan_classes(root):
    cs = [d for d in sorted(os.listdir(root)) if os.path.isdir(os.path.join(root,d))]
    if not cs: raise RuntimeError(f"資料夾是空的：{root}")
    return cs, {c:i for i,c in enumerate(cs)}

def make_val_dataset(path, batch=BATCH, val_split=VAL_SPLIT, seed=42):
    _ = tf.keras.preprocessing.image_dataset_from_directory(
        path, label_mode="int", image_size=(IMG_SIZE, IMG_SIZE),
        batch_size=batch, shuffle=True, validation_split=val_split, subset="training", seed=seed)
    val_ds = tf.keras.preprocessing.image_dataset_from_directory(
        path, label_mode="int", image_size=(IMG_SIZE, IMG_SIZE),
        batch_size=batch, shuffle=False, validation_split=val_split, subset="validation", seed=seed)
    def _pre_tf(x,y): return (tf.cast(x, tf.float32)/127.5 - 1.0, y)
    val_ds = val_ds.map(_pre_tf, num_parallel_calls=tf.data.AUTOTUNE)
    val_ds = val_ds.cache().prefetch(tf.data.AUTOTUNE)
    val_ds = val_ds.map(lambda x,y: (x, {"emb":y, "cls":y}))
    return val_ds

def make_pk_dataset(root, batch=BATCH, P=P_CLASSES, steps=STEPS_PER_EPOCH, seed=42):
    rng = random.Random(seed)
    classes, cls2idx = scan_classes(root)
    P_eff = min(P, len(classes))
    assert batch % P_eff == 0, f"BATCH({batch}) 必須能被有效 P({P_eff}) 整除"
    K = batch // P_eff
    assert K >= 2, "Triplet 需要 K >= 2"
    pool = {}
    for c in classes:
        files = []
        for e in ("*.jpg","*.jpeg","*.png","*.bmp","*.pgm","*.ppm","*.JPG","*.PNG","*.JPEG","*.BMP"):
            files += glob.glob(os.path.join(root, c, "**", e), recursive=True)
        if files: pool[c]=files
    keys = list(pool.keys())

    def gen():
        while True:
            chosen = rng.sample(keys, P_eff) if len(keys)>=P_eff else [rng.choice(keys) for _ in range(P_eff)]
            X,Y = [],[]
            for c in chosen:
                fs = pool[c]
                pick = rng.sample(fs, K) if len(fs)>=K else [rng.choice(fs) for _ in range(K)]
                for p in pick:
                    im = _imread_u(p)
                    if im is None: continue
                    X.append(_pre_bgr(im)); Y.append(cls2idx[c])
            while len(X)<batch:
                c=rng.choice(keys); im=_imread_u(rng.choice(pool[c]))
                if im is None: continue
                X.append(_pre_bgr(im)); Y.append(cls2idx[c])
            x = np.stack(X,0).astype(np.float32); y = np.array(Y,np.int32)
            yield (x, {"emb":y, "cls":y})
    spec = (
        tf.TensorSpec((batch,IMG_SIZE,IMG_SIZE,3), tf.float32),
        {"emb": tf.TensorSpec((batch,), tf.int32), "cls": tf.TensorSpec((batch,), tf.int32)}
    )
    ds = tf.data.Dataset.from_generator(gen, output_signature=spec).prefetch(tf.data.AUTOTUNE)
    return ds, steps, P_eff, K, len(classes)

# ----- Triplet（修正遮罩） -----
def make_batch_hard_triplet_loss(margin=MARGIN):
    @tf.function
    def loss(y_true, y_pred):
        labels = tf.cast(y_true, tf.int32)                  # [B]
        sim = tf.matmul(y_pred, y_pred, transpose_b=True)   # cosine
        dist = tf.maximum(2.0 - 2.0*sim, 0.0)
        B = tf.shape(labels)[0]
        l1 = tf.expand_dims(labels,0); l2 = tf.expand_dims(labels,1)
        mask_pos = tf.logical_and(tf.equal(l1,l2), tf.logical_not(tf.eye(B,dtype=tf.bool)))
        mask_neg = tf.logical_not(tf.equal(l1,l2))
        pos = tf.where(mask_pos, dist, tf.fill(tf.shape(dist), tf.constant(-1e9, tf.float32)))
        neg = tf.where(mask_neg, dist, tf.fill(tf.shape(dist), tf.constant( 1e9, tf.float32)))
        hardest_pos = tf.reduce_max(pos, axis=1)
        hardest_neg = tf.reduce_min(neg, axis=1)
        return tf.reduce_mean(tf.nn.relu(margin + hardest_pos - hardest_neg))
    return loss

# ========= 主程式 =========
if __name__ == "__main__":
    # 路徑健檢（相對 → 絕對）
    ABS_DATA = DATA_DIR if DATA_DIR.is_absolute() else (Path.cwd() / DATA_DIR).resolve()
    if not ABS_DATA.exists():
        raise FileNotFoundError(f"找不到資料集資料夾：{ABS_DATA}\n請建立 {ABS_DATA}\\<人名>\\*.jpg")
    print(f"Dataset 目錄：{ABS_DATA}")

    # Threads/GPU 設定
    n = os.cpu_count() or 4
    tf.config.threading.set_intra_op_parallelism_threads(n)
    tf.config.threading.set_inter_op_parallelism_threads(max(2,n//2))
    for g in tf.config.list_physical_devices('GPU'):
        try: tf.config.experimental.set_memory_growth(g, True)
        except: pass

    print("Loading dataset from:", ABS_DATA)
    val_ds = make_val_dataset(str(ABS_DATA))
    train_pk, STEPS, P_eff, K_each, NUM_CLASSES = make_pk_dataset(str(ABS_DATA))
    print(f"P×K：P_eff={P_eff}, K={K_each}, batch={BATCH}, steps/epoch={STEPS}, classes={NUM_CLASSES}")

    # 建模：兩個輸出 —— emb (L2) + cls（分類頭）
    base = tiny_mobilefacenet()
    emb, feat = base.output  # emb: L2, feat: 未正規化
    cls = layers.Dense(NUM_CLASSES, activation="softmax", name="cls")(feat)
    model = models.Model(base.input, outputs={"emb": emb, "cls": cls})

    # Callbacks
    ckpt_best = tf.keras.callbacks.ModelCheckpoint(filepath=str(BEST_KERAS), monitor="val_cls_loss",
                                                   mode="min", save_best_only=True)
    ckpt_last = tf.keras.callbacks.ModelCheckpoint(filepath=str(LAST_KERAS), save_best_only=False)
    tb  = tf.keras.callbacks.TensorBoard(log_dir=str(LOGS_DIR))
    rlr = tf.keras.callbacks.ReduceLROnPlateau(monitor="val_loss", factor=0.5, patience=5, min_lr=1e-5)
    es  = tf.keras.callbacks.EarlyStopping(monitor="val_loss", patience=12, restore_best_weights=True)

    # ===== Phase A：分類暖身（僅 CE）=====
    optA = tf.keras.optimizers.Adam(LR_A, clipnorm=1.0)
    model.compile(optimizer=optA,
                  loss={"emb": make_batch_hard_triplet_loss(margin=MARGIN), "cls": tf.keras.losses.SparseCategoricalCrossentropy()},
                  loss_weights={"emb": 0.0, "cls": 1.0},
                  metrics={"cls": "accuracy"})
    print("\n=== Phase A: CE warm-up ===")
    model.fit(train_pk, steps_per_epoch=STEPS, validation_data=val_ds, epochs=EPOCHS_A,
              callbacks=[ckpt_last, tb])

    # ===== Phase B：Triplet 微調（CE 做穩定器）=====
    optB = tf.keras.optimizers.Adam(LR_B, clipnorm=1.0)
    model.compile(optimizer=optB,
                  loss={"emb": make_batch_hard_triplet_loss(margin=MARGIN), "cls": tf.keras.losses.SparseCategoricalCrossentropy()},
                  loss_weights={"emb": 1.0, "cls": 0.1},
                  metrics={"cls": "accuracy"})
    print("\n=== Phase B: Triplet fine-tune ===")
    model.fit(train_pk, steps_per_epoch=STEPS, validation_data=val_ds, epochs=EPOCHS_B,
              callbacks=[ckpt_best, ckpt_last, tb, rlr, es])

    print("✅ Saved best/last to:")
    print(" -", BEST_KERAS.resolve())
    print(" -", LAST_KERAS.resolve())
    print("Logs:", LOGS_DIR.resolve())

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-08-21 16:42
关注
下午好🌅🌅🌅
本答案参考通义千问

你提到在训练 MobileFaceNet 模型时遇到了**特征崩溃（Feature Collapse）**的问题，导致无法正确识别人脸。并且你将模型转换为 INT8 量化版本 部署到 HT32F49395 上，但问题依旧存在。以下是详细的分析和解决方案：

一、特征崩溃的可能原因

1. 训练过程中损失函数设计不当

MobileFaceNet 使用的是 ArcFace 或 CosFace 等具有角度边界的损失函数。
如果这些损失函数的参数设置不合理（如 margin、scale 等），可能导致特征向量过于集中，造成“特征崩溃”。

2. 量化过程中的精度丢失

将模型从 FP32 转换为 INT8 时，精度丢失可能导致特征向量变得模糊或重复。
特别是在量化前没有进行 校准（calibration），或者校准数据不够多样，会导致量化后的特征空间不准确。

3. 数据分布不平衡

如果训练数据中某些类别的样本过少，模型无法学习到足够的区分性特征，导致特征向量相似度高。

4. 模型结构或训练策略问题

如网络深度不足、正则化方法（如 Dropout、L2 正则化）使用不当，也可能导致特征崩溃。

二、解决特征崩溃的详细步骤

1. 检查并优化损失函数配置

重点：确保损失函数参数合理

# 示例：ArcFace 损失函数配置 import torch from torch.nn import functional as F def arcface_loss(logits, labels, s=30.0, m=0.5): cosine = F.normalize(logits, dim=1) one_hot = torch.zeros_like(cosine) one_hot.scatter_(1, labels.view(-1, 1).long(), 1) theta = torch.acos(torch.clamp(cosine * one_hot, -1.0 + 1e-7, 1.0 - 1e-7)) target_logit = torch.cos(theta + m) logits = (one_hot * target_logit) + ((1.0 - one_hot) * cosine) logits *= s return logits

建议：

s（scale） 建议设为 30~60；
m（margin） 建议设为 0.5~0.8；
若使用 CosFace，可调整 m 为 0.3~0.5。

2. 量化前进行校准（Calibration）

重点：量化前必须用真实数据进行校准，否则特征会严重退化。

步骤：

准备校准数据集：使用与训练集相似但未用于训练的数据。
运行量化流程：
# 使用 TensorFlow Lite 的量化工具 tflite_convert \ --input_file=model_float32.tflite \ --output_file=model_int8_quantized.tflite \ --input_shapes=1,112,112,3 \ --default_ranges_min=-10 \ --default_ranges_max=10 \ --quantize=True \ --calibrate_dataset=path_to_calibration_data

注意： 校准数据应包含足够多的类别样本，以确保模型能学到不同的特征分布。

3. 检查训练数据的分布情况

重点：数据多样性不足会导致特征崩溃

使用以下代码检查数据分布：
from collections import Counter # 假设 labels 是训练数据的标签列表 label_counts = Counter(labels) print(label_counts)

建议：

确保每个类别至少有 100 个样本；
若类别不平衡，考虑使用 重采样（oversampling） 或 加权损失函数。

4. 添加正则化项增强特征区分性

重点：增加 L2 正则化或 Dropout

# 在模型定义中加入 L2 正则化 model = MobileFaceNet() for param in model.parameters(): param.register_hook(lambda grad: grad * 0.1) # 可选：L2 正则化 # 或者在训练时添加 L2 正则化 loss = criterion(outputs, labels) + 0.001 * sum(p.pow(2).sum() for p in model.parameters())

5. 检查模型输出特征的分布

重点：使用可视化工具观察特征分布

import matplotlib.pyplot as plt import numpy as np # 假设 features 是模型的输出特征（N, D） features = np.random.randn(3, 64) # 示例数据 plt.scatter(features[:, 0], features[:, 1]) plt.title("Feature Distribution") plt.show()

如果特征点高度集中，说明模型未学到有效特征，需重新训练或调整损失函数。

三、量化后模型的验证建议

1. 验证量化模型的输出特征

import tensorflow as tf interpreter = tf.lite.Interpreter(model_path="model_int8_quantized.tflite") interpreter.allocate_tensors() input_details = interpreter.get_input_details() output_details = interpreter.get_output_details() # 输入数据 input_data = np.random.rand(1, 112, 112, 3).astype(input_details[0]["dtype"]) interpreter.set_tensor(input_details[0]["index"], input_data) interpreter.invoke() output_data = interpreter.get_tensor(output_details[0]["index"]) print("Quantized Output Shape:", output_data.shape) print("Output Min/Max:", output_data.min(), output_data.max())

注意： 如果输出特征范围过小（如接近 0），可能是量化导致信息丢失。

四、总结：关键改进点

优化损失函数参数，确保边界清晰；
进行量化前的校准，避免特征退化；
检查训练数据分布，保证类别平衡；
添加正则化机制，提升特征区分性；
验证量化后的模型输出，确保特征仍具备判别力。

如果你愿意提供训练脚本或模型结构，我可以进一步帮助你定位问题。希望这些建议能帮助你解决 MobileFaceNet 的特征崩溃问题！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

算法部署-使用NCNN部署MobileFacenet人脸检测算法-优质算法部署项目实战.zip
2024-10-18 17:36

在当前人工智能快速发展的时代，人脸检测技术作为计算机视觉领域的一个重要应用方向，其算法部署的便捷性和高效性显得尤为重要。本实战项目旨在通过NCNN这一轻量级神经网络框架，实现对MobileFaceNet人脸检测算法的...
Pytorch实现的人脸识别明细MobileFaceNet模型
2023-07-01 11:25

**Pytorch实现的人脸识别详解：MobileFaceNet模型** 在当今的计算机视觉领域，人脸识别是一项关键技术，广泛应用于安全监控、身份验证以及社交媒体等场景。本文将深入探讨如何使用PyTorch框架实现基于MobileFaceNet...
MobileFaceNet模型分析
2022-03-11 10:55

牧羊女说的博客 AI算法半路出家的过程其实是有点痛苦的，告别了曾经熟悉的领域，在陌生又熟悉的道路上摸索着前进，其中的焦虑、彷徨以及面对信息过载的不知所措，常常让人怀疑当初的选择。好在，硬核人生不会被小小的困难劝退，我们...
基于MobileFaceNet的静默活体检测系统python源码+项目说明（高分毕业设计）.zip
2023-10-31 20:45

基于MobileFaceNet的静默活体检测系统python源码+项目说明.zip 已获导师指导并通过的高分毕业设计项目，也可作为课程设计和期末大作业，下载即用无需修改，项目完整确保可以运行。 1、代码csdn下载解压 2、实验环境...
mobilefacenet
2020-03-23 00:33

AI算法网奇的博客权重4m ...class MobileFaceNet(Module): def __init__(self, embedding_size): super(MobileFaceNet, self).__init__() self.conv1 = Conv_block(3, 64, kernel=(3, 3), stride=(2, 2), padding=(...
AI人工智能为家居控制边缘计算节点设计赋能
2025-07-05 01:44

AI架构师小马的博客资源约束计算能力：典型边缘节点仅配备1-2W TDP的处理器，较智能手机低10-50倍内存限制：通常为MB级内存，远低于服务器环境的GB级配置存储容量：嵌入式环境下通常限制在数百MB至几GB能源预算：电池供电设备要求微安...
基于MobileFaceNet的静默活体检测系统python源码+项目说明.zip
2023-09-05 17:22

2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。...
MobileFaceNet编程实现
2021-03-31 18:54

Ma lidong的博客 if __name__ == '__main__': # 创建模型 model = MobileFaceNet(512, 7, 7) # 加载模型 # model = model.load_model(model, "/home/malidong/workspace/mobilefacenet/Epoch_17.pt") print(model)
基于MTCNN和MobileFaceNet的人脸识别
2021-02-01 16:52

hust_zhengT的博客本项目的主要目标是基于NCNN和Opencv库，实现MTCNN人脸检测和对齐，得到人脸之后，再调用预训练的MobileFaceNet模型进行人脸识别，并用Opencv实现项目可视化和人机交互功能。通过调用摄像头，用户可以自行拍照并保存...
MobileFaceNet_TF 开源项目教程
2024-08-20 09:23

缪玺彬的博客 MobileFaceNet_TF 开源项目教程项目介绍 MobileFaceNet_TF 是一个基于 TensorFlow 的轻量级人脸识别框架，专为移动设备设计。该项目旨在提供高效、实时的人脸识别解决方案，适用于资源受限的环境。MobileFaceNet_TF...
基于MobileFaceNet的静默活体检测系统的设计与实现python源码+项目说明+模型.zip
2024-04-11 23:04

2、适用人群：主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用，具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习，也...
AI人工智能优化人脸识别机器人边缘计算的实践探索
2025-07-11 01:51

AIGC应用创新大全的博客 AI人工智能优化人脸识别机器人边缘计算的实践探索元数据框架标题：基于AI优化的人脸识别机器人边缘计算系统：理论架构、实践挑战与未来演进关键词：边缘计算、人脸识别、轻量化模型、实时推理、机器人感知、模型...
AI人工智能赋能：人脸识别机器人边缘计算优化全攻略
2025-07-09 22:31

AI架构师小马的博客人脸识别机器人是AI+机器人的典型应用，核心功能是通过摄像头采集图像，实时识别人员身份，支撑安防巡逻（园区可疑人员预警）、零售服务（商场顾客个性化推荐）、酒店引导（客人身份验证与路径指引）等场景。...
MobileFaceNet_TF 安装和配置指南
2024-09-13 22:47

苏顺霞Wolf的博客 MobileFaceNet_TF 安装和配置指南 1. 项目基础介绍和主要编程语言项目介绍 MobileFaceNet_TF 是一个基于 TensorFlow 实现的 MobileFaceNet 模型，旨在提供高效的实时人脸验证功能。该项目适用于移动设备，能够在...
【亲测免费】 MobileFaceNet_TF 项目教程
2024-08-15 09:50

穆千伊的博客 MobileFaceNet_TF 项目教程项目介绍 MobileFaceNet_TF 是一个基于 TensorFlow 的深度学习模型，专为移动设备设计，用于高效、实时的人脸识别任务。这个项目旨在提供一个可以在资源有限的移动平台上运行的人脸识别...
MobileFaceNet_TF 项目常见问题解决方案
2024-09-13 22:47

郝有辛Magda的博客项目链接: https://github.com/sirius-ai/MobileFaceNet_TF 主要编程语言: Python 项目简介: MobileFaceNet_TF 是一个基于 TensorFlow 实现的 MobileFaceNet 模型，用于在移动设备上进行高效的人...
探索AI人脸识别机器人边缘计算优化的核心价值
2025-07-11 10:54

AI原生应用开发的博客 AI人脸识别机器人的核心矛盾是有限资源与高需求资源约束：机器人的嵌入式设备受限于体积、重量、功耗，计算能力（如FLOPs）通常仅为云端服务器的1/100~1/10（例如，Jetson Nano的FP32计算能力为0.47 TFLOPs，而AWS p...
推荐文章：轻量级人脸识别新秀 —— MobileFaceNet
2024-08-21 08:46

井唯喜的博客随着人工智能技术的迅速发展，人脸识别已经成为日常生活中不可或缺的一部分，从解锁手机到智能安防，高效而精准的身份验证至关重要。今天，我们要向大家推荐一款名为MobileFaceNet的开源项目，它正是在这一领域的...
人工智能：从算法到应用：跨领域学习和实践案例
2023-07-27 01:25

光子AI的博客 人工智能(AI)是一个非常具有社会意义的产物，它将人类与机器相互融合，使得人类和机器可以完成各种各样的工作、交流、沟通、学习等。随着人工智能技术的不断发展，人们越来越关注人工智能在医疗诊断、图像识别、自然...
树莓派5+AI识别学习 -环境准备树莓派5b
2025-04-02 11:09

wito.chen的博客树莓派+AI+opencv 学习第一课
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月21日

mobilefacenet

5条回答 默认 最新

一、特征崩溃的可能原因

1. 训练过程中损失函数设计不当

2. 量化过程中的精度丢失

3. 数据分布不平衡

4. 模型结构或训练策略问题

二、解决特征崩溃的详细步骤

1. 检查并优化损失函数配置

2. 量化前进行校准（Calibration）

步骤：

3. 检查训练数据的分布情况

4. 添加正则化项增强特征区分性

5. 检查模型输出特征的分布

三、量化后模型的验证建议

1. 验证量化模型的输出特征

四、总结：关键改进点

问题事件

5条回答默认最新