MTCNN Landmark_5文件怎么生成？

利用 MTCNN 对人脸图像进行预处理，从而得到人脸图像的 Landmark 文件。其中，我们选择五个人脸关键点，即“左眼，右眼，鼻尖，左嘴角，右嘴角”

这一步在很多论文里都有，但是具体是怎么处理生成的呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

ilmss 2022-07-28 09:46

关注

请参考一下代码：

import sys
sys.path.append('D:\\Anaconda2\\libs')  #导入系统路径，以便cv2模块的导入
 
import numpy as np
import cv2
import os
import numpy.random as npr
from utils import IoU
 
stdsize = 48
# 标注txt文件路径，celebA原图路径
anno_file = "E:/face_alignment/data/CelebA/Anno/celebA_bbox_landmark.txt"
im_dir = "E:/face_alignment/data/CelebA/Img/img_celeba.7z/img_celeba/"
# landmark样本的保存路径
pos_save_dir = str(stdsize) + "/landmark"
save_dir = "./" + str(stdsize)
 
# 创建文件夹函数
def mkr(dr):
    if not os.path.exists(dr):
        os.mkdir(dr)
 
mkr(save_dir)
mkr(pos_save_dir)
 
f1 = open(os.path.join(save_dir, 'landmark_' + str(stdsize) + '.txt'), 'w')
with open(anno_file, 'r') as f:
    annotations = f.readlines()
num = len(annotations)
print "%d pics in total" % num
p_idx = 0 # positive
d_idx = 0 # dont care
idx = 0
box_idx = 0
 
for annotation in annotations:
    # strip()：去除annotations开头、结尾处空白符，split(' ')按空格进行切片
    annotation = annotation.strip().split(' ')
    im_path = annotation[0]  # 图片名
    bbox = map(float, annotation[1:-10])  # bbox 坐标
    pts = map(float, annotation[-10:])    # landmark 坐标
    boxes = np.array(bbox, dtype=np.float32).reshape(-1, 4)  # 将bbox转化为矩阵，并将列resize为4
    im_path = im_dir + im_path  # 图片全路径
    img = cv2.imread(im_path)  # 读取图片
    idx += 1
    if idx % 100 == 0:
        print idx, "images done"
 
    height, width, channel = img.shape
 
 
    backupPts = pts[:]        
    for box in boxes:
        # box (x_left, y_top, x_right, y_bottom)
        x1, y1, x2, y2 = box
        w = x2 - x1 + 1
        h = y2 - y1 + 1
 
        # ignore small faces
        # in case the ground truth boxes of small faces are not accurate
        if max(w, h) < 12 or x1 < 0 or y1 < 0:
            continue
 
        # generate landmark examples and part faces
        # 对bbox进行随机scale,offset，得到新的crop区域，即对样本进行扰动，做样本增强
        for i in range(10):
            pts = backupPts[:]
            size = npr.randint(int(min(w, h) * 0.9), np.ceil(1.1 * max(w, h)))
            # scale做(0.9~1.1)之间扰动，offser做(-0.1~0.1)之间扰动
            # delta here is the offset of box center
            delta_x = npr.randint(-w * 0.1, w * 0.1)
            delta_y = npr.randint(-h * 0.1, h * 0.1)
 
            nx1 = max(x1 + w / 2 + delta_x - size / 2, 0)
            ny1 = max(y1 + h / 2 + delta_y - size / 2, 0)
            nx2 = nx1 + size
            ny2 = ny1 + size
 
            if nx2 > width or ny2 > height:
                continue
            crop_box = np.array([nx1, ny1, nx2, ny2])
 
            offset_x1 = (x1 - nx1) / float(size)
            offset_y1 = (y1 - ny1) / float(size)
            offset_x2 = (x2 - nx2) / float(size)
            offset_y2 = (y2 - ny2) / float(size)
 
            # 当且仅当五个landmark都在随机扰动生成的crop区域中时，才保持使用
            if pts[0] < nx1 or pts[0] > nx2:
                continue
            if pts[2] < nx1 or pts[2] > nx2:
                continue
            if pts[4] < nx1 or pts[4] > nx2:
                continue
            if pts[6] < nx1 or pts[6] > nx2:
                continue
            if pts[8] < nx1 or pts[8] > nx2:
                continue
            
            if pts[1] < ny1 or pts[1] > ny2:
                continue
            if pts[3] < ny1 or pts[3] > ny2:
                continue
            if pts[5] < ny1 or pts[5] > ny2:
                continue
            if pts[7] < ny1 or pts[7] > ny2:
                continue
            if pts[9] < ny1 or pts[9] > ny2:
                continue
            
            ptss = pts[:]
            # 将landmark转化为相对于左上角的归一化值
            for k in range(len(ptss) / 2):
                pts[k] = (ptss[k*2] - nx1) / float(size);
                pts[k+5] = (ptss[k*2+1] - ny1) / float(size);
 
            # 从原图中crop图片区域，并resize成stdsize大小
            cropped_im = img[int(ny1) : int(ny2), int(nx1) : int(nx2), :]
            resized_im = cv2.resize(cropped_im, (stdsize, stdsize), interpolation=cv2.INTER_LINEAR)
 
            box_ = box.reshape(1, -1)
 
            # 将图片名，bbox偏移量写入txt文本中
            save_file = os.path.join(pos_save_dir, "%s.jpg"%p_idx)
            f1.write(str(stdsize)+"/landmark/%s.jpg"%p_idx + ' -1 -1 -1 -1 -1')
             
            # 将landmark坐标写入txt文件中
            for k in range(len(pts)):
                f1.write(" %f" % pts[k])
            f1.write("\n")
            cv2.imwrite(save_file, resized_im)  # 保存图片
            p_idx += 1
            
 
        box_idx += 1
        print "%s images done, pos: %s part: %s "%(idx, p_idx, d_idx)
 
f1.close()

报告相同问题？

关注问题

opencv找不到文件（文件存在但找不到，如何解决？(语言-java) java opencv 有问必答计算机视觉
2022-02-07 03:52

回答 2 已采纳据我猜测，contribut包需要编译的吧，没有编译不能直接使用的，除非你把它当成另外的cpp文件而不是opencv的组件来使用（我也不确定当成另外的cpp文件能不能行的通，但是编译是没有问题的）
python中遇到的问题，这是哪里出错了？ python
2022-03-14 10:49

回答 1 已采纳 pose_recognition.Pose是一个类，需要先实例化才能调用process函数，所以第15行改成： result =pose_recognition.Pose().process(imgs
TypeError: add_argument() takes 2 positional arguments but 3 were given 这个报错怎么解决 keras python tensorflow
2022-04-25 11:28

回答 3 已采纳报错的具体信息贴出来看看，add_argument()这个函数看看形参，错误是因为你多传了一个参数进去了
tensorflow2.0 实现MTCNN、P_net数据生成，及训练-1
2021-04-06 17:53

Replete的博客 1.MTCNN 的优点及必须要了解基础点。MTCNN 的 “MT”是指多任务学习（Multi-Task）,在同一个任务中同时学习“分类识别”、“边框回归”，“关键点识别”。多尺度问题一直是困扰检测准确性的一个难点。MTCNN使用图像...
python面部表情分析py-feat报错 python
2022-12-28 22:10

回答 2 已采纳这个跟修改文件名称没关系，你看看download_url(url,...)中url的值是多少，是不是无法访问下载。
跟进：xml到php数组的正确转换是什么？ [重复] php xml
2014-11-03 06:43

回答 1 已采纳 What about simple: $xml = simplexml_load_string($xmlstring); $json = json_encode($xml); $array =
HRNet训练自己的数据集 pytorch 计算机视觉
2023-03-02 11:19

回答 2 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵHRNet在进行姿态估计时确实是一个top-down算法，但它使用的目标检测器是单独训练的，并不需要在姿态估计时加载目标检测权重。因此，在官方代码中你也不会找到需要加载目标
tensorflow2.0 实现MTCNN、P_net数据生成，及训练-2
2021-04-06 17:56

Replete的博客 2.1我们开始进入编写P_NET、R...MTCNN_.pyimport tensorflow.keras as keras import tensorflow as tf import numpy as np import cv2 #处理的12X12网络 def Pnet(): input = tf.keras.Input(shape=[None, None,...
matplotlib.plt中图颜色的绘制 python
2023-04-13 21:43

回答 2 已采纳 import matplotlib.pyplot as plt import numpy as np # 创建一个点的坐标 x = 1 y = 2 # 颜色设置 color = np.array(
串口连接改为TCP Server进行网络连接 python tcp/ip 网络协议
2023-03-26 23:56

回答 3 已采纳 ' import mediapipe as mp import cv2 import numpy as np import socket def get_angle(v1, v2): ang
paypal付款网关链接直接付款 php
2014-06-30 12:23

回答 1 已采纳 When using Payments Standard like this the Guest Checkout (direct credit card) option is displayed
MTCNN各个函数子文件的说明
2019-04-20 14:04

笔尖微凉的博客 MTCNN由3个网络结构组成（P-Net,R-Net,O-Net）。 Proposal Network (P-Net)：该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归，对候选窗口进行校准，然后通过非极大值抑制（NMS）来...
求助：springboot报错：Caused by: java.net.ConnectException: connect: Address is invalid on local machine, or port is not valid on remote machine intellij-idea java spring
2019-10-16 17:39

回答 2 已采纳请求的ip地址不对，确认一下你调用的服务的地址是否正确
pytorch_face_landmark-master.zip
2020-03-31 19:20

"pytorch_face_landmark-master.zip"这个压缩包文件正是针对这一主题，包含了一个基于PyTorch框架实现的人脸关键点检测模型。本文将详细探讨其背后的原理、实现方法以及可能的应用场景。首先，人脸关键点检测是...
利用MTCNN和facenet实现人脸检测和人脸识别
2019-05-14 11:16

老三是只猫的博客人脸检测和人脸识别技术算是目前人工智能方面应用最成熟的技术了。本博客将利用mtcnn和faceNet搭建一个实现人脸检测和人脸识别的系统。基本思路也很简单，先利用mtcnn的进行人脸检测，当然也可以使用其他的人脸检测...
『人脸识别』MTCNN之Pytorch版本教科书式详解
2020-02-11 21:13

沉浸式AI的博客本文详细讲解了人工智能深度学习中最经典的神经网络之一：MTCNN。2万多字的内容，主要从理论和实践两方面对MTCNN进行详细分析，堪比教科书。话不读说，开始你的旅程吧！目录：基础闲聊人脸识别思想 MTCNN理论...
人脸检测算法模型MTCNN
2023-01-11 21:52

一壶浊酒..的博客人脸检测算法模型MTCNN
MTCNN人脸识别趟坑实录2019
2019-01-03 14:56

cm02070601的博客 MTCNN人脸识别趟坑实录2019MTCNN论文相关的基本原理从识别过程理解P-Net的功能：R-Net的功能O-Net的功能数据集的准备负样本一些杂项网络输入输出结构的坑图片演示我的工程参考论文参考博客参考工程 MTCNN论文相关的...
landmark.rar
2019-10-15 09:26

此外，它还可以结合其他技术，如人脸识别、表情识别，为人工智能应用提供更丰富的信息。在Python环境中，这样的程序通常会用到OpenCV、TensorFlow、Keras等库。OpenCV用于图像处理，而TensorFlow和Keras则是深度...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月28日

悬赏问题

¥30 STM32 INMP441无法读取数据
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥15 各位帮我看看如何写代码，打出来的图形要和如下图呈现的一样，急
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error
¥15 VS2022+WDK驱动开发环境

MTCNN Landmark_5文件怎么生成？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新