h.264中，帧间预测，所有相邻宏块都是只用同一个参考帧，只使用P帧，不用B帧。采用中值预测法的疑问？

h.264中，帧间预测，所有相邻宏块都是只用同一个参考帧，只使用P帧，不用B帧。采用中值预测法的疑问？
h.264中，帧间预测，所有相邻宏块都是只用同一个参考帧。采用中值预测法。
1.如果本宏块采用帧间预测：相邻宏块只有一个有效，那么采用中值预测法时，其MVP是多少？
2.下图中打勾红色那个具体怎么理解？因为我们只使用同一个参考帧。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

宝码香车优质创作者: JavaScript技术领域 2025-09-23 23:32

关注

让【宝码香车】来帮您解答，本回答参考DeepSeek编写，并整理提供。

如果答案让您满意，请采纳、点赞、关注，非常感谢！
.
每日一句正能量，让它带给您好心情：努力不是为了超越别人，而是为了成为更好的自己。
.

根据H.264标准（问题图片中的8.4.1.3.1节）和您描述的具体场景（所有宏块使用同一参考帧，仅使用P帧），我来解答您的疑问。

核心结论

在您描述的场景下（所有相邻宏块都可用且使用同一个参考帧），中值预测过程会直接进入最后一步，即取三个相邻块运动向量（mvLXA, mvLXB, mvLXC）各分量的中值作为当前块的MVP。

问题解答

1. 如果本宏块采用帧间预测：相邻宏块只有一个有效，那么采用中值预测法时，其MVP是多少？

根据标准流程的第一步：

情况：只有 mbAddrA 可用，mbAddrB 和 mbAddrC 都不可用。
处理：标准规定，此时会将可用的 mvLXA 和 refIdxLXA 分别复制给不可用的 mvLXB, mvLXC 和 refIdxLXB, refIdxLXC。

   mvLXB = mvLXA
   mvLXC = mvLXA
   refIdxLXB = refIdxLXA
   refIdxLXC = refIdxLXA
   ```


- **后续流程**：由于现在三个参考帧索引 (`refIdxLXA`, `refIdxLXB`, `refIdxLXC`) 都变得相同，并且它们必然等于当前块的参考帧索引 (`refIdxLX`)（因为您指定了所有宏块使用同一参考帧），流程将进入第二步的“Otherwise”情况。
- **最终MVP**：计算三个**完全相同**的运动向量的中值。一个集合的中位数就是它本身。


```clike
   mvpLX[0] = Median(mvLXA[0], mvLXA[0], mvLXA[0]) = mvLXA[0]
   mvpLX[1] = Median(mvLXA[1], mvLXA[1], mvLXA[1]) = mvLXA[1]
   ```


- **答案**：**MVP 就是那个唯一有效的相邻宏块的运动向量 `mvLXA`**。


#### 2. 下图中打勾红色那个具体怎么理解？（因为我们只使用同一个参考帧）


您图片中第二步的流程可以简化为一个决策树。在您设定的条件下（所有参考帧相同），这个决策树的路径是确定的：


1. **判断条件**：“if one and only one of the reference indices ... is equal to the reference index of the current partition”（如果三个相邻块中**有且仅有一个**的参考帧索引与当前块相同）。
2. **在您的场景下**：由于所有宏块（当前块和三个相邻块）都使用**同一个参考帧**，所以三个相邻块的参考帧索引 (`refIdxLXA`, `refIdxLXB`, `refIdxLXC`) **全都等于**当前块的参考帧索引 (`refIdxLX`)。
3. **路径选择**：上述条件（“有且仅有一个相等”）**不成立**。因此，流程会跳过这个 `if` 分支，直接进入 `Otherwise` 分支。
4. **`Otherwise` 分支的处理**：这就是您图中打勾的红色部分。它规定直接取三个运动向量各分量的中值。


```clike
   mvpLX[0] = Median(mvLXA[0], mvLXB[0], mvLXC[0])
   mvpLX[1] = Median(mvLXA[1], mvLXB[1], mvLXC[1])
   ```


**总结理解**：那个打勾的红色部分是一个“保底”或“通用”策略。当三个相邻块的参考帧情况比较复杂（比如不全是当前参考帧，或者全是但不符合“有且仅有一个”的特殊条件时），就采用这种稳健的**中值滤波**方法来得到一个预测值，这通常能有效平滑掉个别运动向量的异常，得到一个相对合理的预测。在您“全同参考帧”的简单场景下，这个策略同样适用且结果正确。

报告相同问题？

关注问题

H264帧间预测
2023-12-20 16:23

Neil_baby的博客还有一种情况是A，B,C的被划分成更小的partition，如下图中第二个图所示，那么A，B，C都取和E最接近的partition，A取E的相邻宏块的右上方的partition，B取E上方宏块左下方的partition，C取E右上方宏块的左下方的...
H.264 White Paper学习笔记——帧内预测
2022-10-25 17:37

贺二公子的博客 H.264 帧内预测
H264/AVC-帧间预测1（skip和direct预测模式的mv和ref_idx的推导）
2021-05-13 17:19

言午许成长的博客在宏块类型里介绍了I、P、B slice中的宏块类型解析，其中P_Skip、B_Skip、B_Direct这几种宏块类型并没有在码流中编码宏块运动矢量和参考帧索引信息。本文主要介绍这几种情况下，mv和ref_idx推导过程。 mv预测在帧...
H.264 入门篇 - 07 (帧间预测 - 解码图像缓存 DPB)
2022-10-15 23:02

爱洋葱的博客当解码器收到一个IDR帧时会立即将DPB清空，因为H.264协议规定一个IDR帧之后的任何帧都不会引用该IDR之前的任何帧，所以DPB中的数据已失效，可以清空。在做视频解码时，需要将最近的若干幅参考帧缓存起来，这个缓冲区...
H.264 压缩与编解码原理
2024-04-05 13:27

UestcXiye的博客 H.264 压缩与编解码原理
MPEG-1中I、B、P帧的基本编码原理
2019-08-20 11:45

houxiaoni01的博客在上篇文章中，我们对MPEG-1有了一个轮廓性的介绍，知道视像序列中的图像类型有三种，分别为I帧、P帧、和B帧。但是我们并没有更深入的去了解，编码这三种类型的图像数据时所采用的不同方式，只知道它们都是把图像...
6.H264
2025-01-17 22:40

瓜扯的博客相邻的两帧图像中，查找相似的宏块，记录宏块变化的的矢量（位移和角度）将解压缩后的帧数据与原始图像的帧数据比较，得到残差值。预测后的图像和实际图像还有差距，还需要进行残差处理，，就是最终的压缩数据。1个...
【视频编解码-05】预测编码详解-帧内预测
2021-02-27 17:24

乱红飞的博客定义预测编码最基本的思想是不直接对信号进行编码，而是用前一信号对当前...帧内预测的目的就是使用比完整一帧少很多的数据来表示当前的一帧。为什么可以进行帧内预测呢？一般的，相邻像素的亮度和色度值经常是非
H.264系列文章（三）——帧内预测
2022-05-11 23:08

NBA_1的博客 H.264 White Paper学习笔记（二）帧内预测为什么要有帧内预测？因为一般来说，对于一幅图像，相邻的两个像素的亮度和色度值之间经常是比较接近的，也就是颜色是逐渐变化的，不会一下子突变成完全不一样的颜色。而...
H.264 White Paper学习笔记（二）帧内预测
2019-09-23 23:03

dcph88859的博客为什么要有帧内预测？...很好理解，存储一个像素的亮度值可能需要8个bit，但是如果相邻的两个像素变化不大，我存储一个像素的原始值，以及第二个像素相对第一个像素的变化值，那么第二个值我可能用2个bit就够...
H.264优秀特征
2015-02-28 17:08

炸鸡叔的博客 1、H.264/AVC相对以前的编码方法，以MPEG-2为例，在图像内容预测方面提高编码效率，改善图像质量的主要特点如下： ● 可变块大小运动补偿：选择运动补偿大小和形状比以前的标准更灵活，最小的亮度运动补偿块可以...
H.264 进阶篇 - 宏块类型解析与编码优化实战
2026-02-20 00:32

米西西的博客本文深入解析H.264编码中的宏块类型，重点探讨I Slice、P Slice和B Slice中宏块类型的选择逻辑与优化策略。通过分析宏块分割、预测模式及CBP等关键信息，结合率失真优化原理，提供针对不同视频内容的编码参数调整...
【音视频基础】H264格式分析
2022-12-03 14:39

乔木辛的博客 H264结构中，一幅图像编码后的数据叫一帧，一帧由一个或多个Slice片组成，一片由一个或多个MB宏块组成，一个宏块由16*16的yuv数据组成。宏块是H264编码的基本单位。H264定义了三种帧，I帧，P帧，B帧。group of ...
H.264压缩编码算法介绍
2016-09-23 11:32

Mr_小艾的博客在这里我总结了许多博客专家对H.264压缩编码算法的理解，得出了我个人的一些见解。现在本人正在研究Android视频直播这一方面的知识，只是设备是定制的Android设备，不是很正规的Android系统。所以这一套的算法放在...
帧内预测
2018-04-17 10:04

NJUdudu的博客因为一般来说，对于一幅图像，相邻的两个像素的亮度和色度值之间经常是比较接近的，也就是颜色是逐渐变化的，不会一下子突变成完全不一样的颜色。而进行视频编码，目的就是利用这个相关性，来进行压缩。帧内预测是...
H264编解码过程简述
2025-08-23 21:23

固执的你的博客 •核心是预测：帧内压缩的效率极大程度上依赖于预测的准确性。预测越准，残差越小，越容易压缩。•灵活的块划分：4x4, 8x8, 16x16 的多种选择让编码器能自适应图像内容。•率失真优化...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月23日