headforever 2025-09-24 09:06 采纳率: 40.3%

在h.264中，假设：本宏块或子宏块为帧间预测模式（全帧仅局限于16x16或8x8），使用P帧（不用B帧），参考帧只有一个，关于相邻宏块的疑惑？

在h.264中，假设：本宏块或子宏块为帧间预测模式（全帧仅局限于16x16或8x8），使用P帧（不用B帧），参考帧只有一个。根据《8.4.1.3 Derivation process for luma motion vector prediction》，在此情况下，使用《8.4.1.3.1 Derivation process for median luma motion vector prediction》，即8.4.1.3.1 中值亮度运动矢量预测值的推导过程。那么疑问如下：
1.根据上面假设，那么就调用了中值预测法，对吗？
2.如果相邻宏块或子宏块只有一个有效或可用，其它要么不存在或帧内预测等等，那么此时，mvp应该等于多少呢？
3.如果相邻宏块或子宏块只有两个有效或可用，其它不存在或帧内预测等等，那么此时，mvp应该等于多少呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

宝码香车优质创作者: JavaScript技术领域 2025-09-24 09:28

关注

让【宝码香车】来帮您解答，本回答参考DeepSeek编写，并整理提供。

如果答案让您满意，请采纳、点赞、关注，非常感谢！
.
每日一句正能量，让它带给您好心情：别让任何人消耗你内心的晴朗，生活应该是被热爱的。
.

根据H.264标准（8.4.1.3.1节）的规定，针对您提出的问题，我将逐一进行解答。

1. 是否调用中值预测法？

是的。在您描述的场景下（P帧、单个参考帧、帧间预测模式），确实会调用8.4.1.3.1节的中值亮度运动矢量预测（Median Luma Motion Vector Prediction）过程来推导MVP。

2. 只有一个相邻块可用时，MVP是多少？

当三个候选相邻块（A₁, B₁, B₀）中只有一个是有效的（即采用帧间预测且参考帧索引相同）时，MVP的值就等于这个唯一有效块的运动矢量（MV）。

推导过程简述：
标准规定，在计算中值前，需要先为三个候选位置（A, B, C）设置默认的MV值。

位置A：对应宏块左侧的A₁子块。
位置B：对应宏块上方的B₁子块。
位置C：对应宏块右上方的B₀子块。

如果某个位置的块不可用（如不存在、为帧内编码、或参考帧索引不同），则该位置的MV会被设置为一个默认值。当仅有一个候选块（例如位置A）可用时，标准的中值计算规则如下：

检查A、B、C三个位置的可用性。
将不可用位置的MV设置为(0, 0)。
计算中值：

mvp_x = Median(mv_A_x, mv_B_x, mv_C_x)
mvp_y = Median(mv_A_y, mv_B_y, mv_C_y)

由于只有一个是非零的有效MV，另外两个是(0, 0)，这三个数的中位数就是那个唯一的非零MV。

示例：
假设只有A₁块可用，其MV为 (5, 2)，而B₁和B₀都不可用。那么：

mvp_x = Median(5, 0, 0) = 0
mvp_y = Median(2, 0, 0) = 0

这个结果是错误的，因为中位数应该是5和2。这里的关键在于，当大量相邻块不可用时，标准有更具体的处理逻辑。实际上，当只有一个块可用时，流程会简化，直接将该可用块的MV作为MVP，而不会进行复杂的中值计算。更准确的描述是：在收集候选MV列表时，如果最终有效的候选MV只有一个，则MVP就直接取这个值。

3. 只有两个相邻块可用时，MVP是多少？

当三个候选相邻块中有两个是有效的时，MVP的值等于这两个有效块运动矢量的中值。在只有两个值的情况下，取中值等价于对这两个MV分量分别取平均值（更准确地说，是去掉最大值和最小值后剩下的那个值，对于两个数来说，就是它们本身）。

推导过程：

假设位置A和B的块可用，其MV分别为 mvA 和 mvB，位置C的块不可用，其MV被设置为 (0, 0)。
分别对x分量和y分量取中值：

mvp_x = Median(mvA_x, mvB_x, 0)
mvp_y = Median(mvA_y, mvB_y, 0)

示例：
假设 mvA = (10, 4), mvB = (6, 8), mvC = (0, 0)（不可用）。

X分量： Median(10, 6, 0)。排序后为 (0, 6, 10)，中值为 6。
Y分量： Median(4, 8, 0)。排序后为 (0, 4, 8)，中值为 4。
因此，最终的MVP为 (6, 4)。

总结

可用相邻块数量	MVP 确定规则	示例（MV值）	结果MVP
1个	MVP = 该可用块的MV	仅A可用：mvA=(5, 2)	(5, 2)
2个	MVP = 两个可用块MV的中值（等价于分别对x和y分量取三个值（mv1, mv2, 0）的中值）	A=(10,4), B=(6,8), C不可用	(6, 4)
3个	MVP = 三个可用块MV的中值（分别对x和y分量取中值）	A=(10,4), B=(6,8), C=(2,12)	(6, 8)

希望以上解答能帮助您彻底理解H.264在中值MVP推导中的细节。

报告相同问题？

关注问题

H264/AVC-帧间预测1（skip和direct预测模式的mv和ref_idx的推导）
2021-05-13 17:19

言午许成长的博客在宏块类型里介绍了I、P、B slice中的宏块类型解析，其中P_Skip、B_Skip、B_Direct这几种宏块类型并没有在码流中编码宏块运动矢量和参考帧索引信息。本文主要介绍这几种情况下，mv和ref_idx推导过程。 mv预测在帧...
音视频之H.265/HEVC编码框架及编码视频格式
2025-04-11 16:44

Everbrilliant89的博客 H.265/HEVC采用混合编码框架，包括变换、量化、熵编码、帧内预测、帧预测以及环路滤波等模块。但是，H.265/HEVC几乎在每个模块都引入了新的编码技术。
从H.265看视频编码的进化之路
2025-07-13 15:27

大雨淅淅的博客其核心技术包括智能四叉树分块机制和35种帧内预测模式，能自适应处理不同复杂度的视频内容。目前H.265已广泛应用于4K影视发行、视频监控和在线视频平台，有效降低存储和带宽成本。尽管H.266已问世，但受制于硬件支持...
H.265视频编码与技术全析（上）
2020-05-01 10:42

wujianming_110117的博客 H.265视频编码与技术全析（上）一．概述作为新一代视频编解码格式，H.265得到越来越广泛的应用。不久之前，苹果公司在翘首期盼中发布了iPhone6，该款手机较之以往的iPhone，不仅仅只是简单地增大了屏幕，其采用了...
【图像处理基石】ISP中的TNR算法详解：原理、实现与优化
2025-03-23 23:41

Andrew-浮游会的博客时域降噪（Temporal Noise Reduction, TNR）是图像信号处理器（ISP）流水线中的核心模块之一，主要用于视频或图像序列的噪声抑制。其核心思想是通过利用多帧图像之间的时间相关性，区分静态背景与动态物体，从而在...
H.264介绍
2013-03-20 14:53

weixin_33845477的博客为什么80%的码农都做不了架构师？>>> ...
H.264学习笔记
2009-09-04 23:40

xxiilei的博客 H.264的编解码框架与以前提出的标准如H.261、H.263及MPEG-1/2/4并无显著变化，也是基于混合编码的方案：以运动矢量代表图象序列各帧的运动内容，使用前面已解码帧对其进行运动估计和补偿或使用帧内预测技术，所得的...
【x265】码率控制模块的简单分析—块级码控工具（AQ和cuTree）
2024-09-13 14:08

东城山的博客 AQ模式的计算位于encoder/slicetype.cpp中，由calcAdaptiveQuantFrame()实现，主要的步骤为： 1. 如果使用hevcAq，则使用xPreanalyze()去分析当前帧 2. 如果使用常规AQ （1）如果使用X265_AQ_EDGE模式，则先进行...
视频原理：预测/变换+量化处理/熵编码/环路过滤器【矢量量化和标量量化(语音识别，图像压缩)等】
2019-06-10 13:03

desaco的博客视频编码：预测 -> 变换+量化处理 -> 熵编码 -> 环路过滤器；视频解码：熵编码 -> 预测 -> 反量化处理+变幻 -> 环路过滤器； ----------- --1. 视频预测谷歌大脑提出基于流的视频预测模型，可...
数字视频编解码基础知识大全
2017-09-08 15:46

mandagod的博客可见光是波长在380 nm～780 nm 之间的电磁波，我们看到的大多数光不是一种波长的光，而是由许多不同波长的光组合成的。如果光源由单波长组成，就称为单色光源。该光源具有能量，也称强度。实际中，只有极少数...
直播推流SDK综述（一）
2020-12-25 15:09

murongxian_1的博客目录 ...3.2 h264原理概述 3.2.1 划分宏块 3.2.2 划分子块 3.2.3 帧分组 3.2.4 运动估计与补偿 3.2.5帧内预测 3.2.6对残差数据做DCT 3.2.7 CABAC 直播涉及到音视频技术，想要深入研究，需...
图像 / 视频
2020-12-02 19:29

ruoge2007的博客亮度信息传达了图片的大部分信息，一部黑白电影相较于彩色电影而言并不会丢失多少细节。色彩信息虽然重要，但是对于人们对于图片的认知而言，并不会有决定性的影响。人的视觉对亮度更加敏感，而对于色彩相对而言没..
mplayer全参数
2011-05-04 16:51

pwg84的博客 VCD、SVCD、DVD、3ivx、DivX 345、WMV 甚至 H.264 格式的电影。 MPlayer 广泛地支持音视频输出驱动。它不仅可以使用 X11, Xv, DGA, OpenGL, SVGAlib, fbdev, AAlib, libcaca, DirectFB, Quartz, Mac OS ...
H.264视频帧分析利器：Elecard Stream Tools实战应用
2025-10-08 06:53

你踩到我法袍了的博客 H.264（又称AVC，Advanced Video Coding）是目前应用最广泛的视频压缩标准之一，广泛应用于高清电视、流媒体传输、视频会议及监控系统中。该标准由ITU-T视频编码专家组（VCEG）与ISO/IEC动态图像专家组（MPEG）联合...
各种压缩格式介绍！(摘录2)
2007-10-17 08:49

gougouzhuzhu的博客但是不知微软出何居心，却将这个MS MPEG4V3 的视频编码内核封闭在仅仅应用于Windows Media流媒体技术上，也就是说，我们经常看到的ASF流媒体文件中。ASF文件虽然有一些优势，但是由于过分的封闭，不能被编辑，未得到...
Mencoder MPlayer 参数详解
2011-12-29 17:22

scoliver的博客 MPlayer(1) 电影播放器 MPlayer(1) D>0> mplayer - 影视播放器 mencoder - 影视编解码器 B>8> mplayer [选项] [文件|URL|播放列表|-] mplayer
图像及视频基础知识
2015-06-23 13:39

coloriy的博客可见光是波长在380 nm～780 nm 之间的电磁波，我们看到的大多数光不是一种波长的光，而是由许多不同波长的光组合成的。如果光源由单波长组成，就称为单色光源。该光源具有能量，也称强度。实际中，只有极少数光源...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月24日