headforever 2025-09-03 10:45 采纳率: 40.3%

h.264前端intra4x4交流数据在残差块Dn之后的DCT运算整数公式、量化整数公式、反量化整数公式、逆DCT整数运算公式？

h.264前端intra4x4交流数据在残差块Dn之后的DCT运算整数公式、量化整数公式、反量化整数公式、逆DCT整数运算公式，以及各个运算阶段的系数位宽、预测值P系数位宽、uF'n系数（uF'n=D'n+ P）位宽？假设视频采样数据为8bit。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-09-03 10:46
关注
上午好☀️☀️☀️️
本答案参考通义千问

在H.264编码标准中，Intra4x4模式下的残差块处理是视频压缩的重要环节。在该模式下，图像数据被分割为4×4的块，进行DCT变换（离散余弦变换）、量化、反量化、逆DCT等操作，最终得到压缩后的码流。

以下是对 H.264 Intra4x4 残差块处理流程 的详细说明，包括各个阶段的整数公式、位宽分析以及相关系数的定义。

一、基本概念

Dn：原始残差块（4×4），每个像素为8 bit。
DCT运算：将空间域的残差块转换到频率域。
量化：对DCT系数进行压缩。
反量化：将量化后的系数还原。
逆DCT：将频率域的系数转换回空间域。
P：预测值（来自相邻块的预测）。
uF'n = D'n + P：预测误差块（用于后续处理）。

二、关键公式与算法

1. DCT运算（整数形式）

H.264使用的是整数DCT，而不是传统的浮点DCT。其计算公式如下：

对于一个4×4的残差块 $ D_n $，进行二维DCT变换后得到 $ F_n $：

$$ F_{i,j} = \sum_{x=0}^{3} \sum_{y=0}^{3} D_{x,y} \cdot \cos\left(\frac{(2x+1)i\pi}{8}\right) \cdot \cos\left(\frac{(2y+1)j\pi}{8}\right) $$

但H.264采用的是整数近似，具体公式如下（简化版本）：

二维整数DCT变换公式（H.264标准）：

$$ F_{i,j} = \frac{1}{2} \cdot \left( \sum_{x=0}^{3} \sum_{y=0}^{3} D_{x,y} \cdot w_x(i) \cdot w_y(j) \right) $$

其中：

$ w_x(i) = \cos\left(\frac{(2x+1)i\pi}{8}\right) $
$ w_y(j) = \cos\left(\frac{(2y+1)j\pi}{8}\right) $

注意：H.264中实际使用的DCT是整数近似，且不使用除法，而是通过移位和加减运算实现。

2. 量化公式（整数形式）

量化公式为：

$$ Q(F_{i,j}) = \text{round}\left( \frac{F_{i,j}}{QScale} \right) $$

其中：

$ QScale $ 是量化步长（由QP决定）
round() 表示四舍五入

量化后的系数为整数，通常为16位或更小。

3. 反量化公式（整数形式）

反量化公式为：

$$ R(Q_{i,j}) = Q_{i,j} \times QScale $$

反量化后得到的是整数近似的DCT系数，用于后续的逆DCT。

4. 逆DCT运算（整数形式）

逆DCT公式为：

$$ D'{x,y} = \sum{i=0}^{3} \sum_{j=0}^{3} R(Q_{i,j}) \cdot w_x(i) \cdot w_y(j) $$

同样，H.264使用的是整数近似，并避免使用除法，通过移位实现。

三、各阶段的位宽分析

| 阶段 | 系数类型 | 位宽 | 说明 | |------|----------|------|------| | Dn | 残差块 | 8 bit | 原始残差，每个像素为8 bit | | F_n | DCT系数 | 16 bit | DCT变换后，通常为16 bit | | Q(F_n) | 量化系数 | 16 bit 或更小 | 量化后的整数系数 | | R(Q(F_n)) | 反量化系数 | 16 bit | 反量化后的近似DCT系数 | | D'_n | 逆DCT后残差 | 8 bit | 最终输出为8 bit，用于重建 |

四、预测值P与uF'n的位宽

P：预测值，通常是8 bit（来自相邻块的预测）
uF'n = D'n + P：预测误差块，结果为8 bit（因为D'n是8 bit，P也是8 bit）

注意：在某些情况下，uF'n可能会有溢出，因此可能需要使用16 bit存储中间结果。

五、代码示例（伪代码）

// 假设 Dn 是 4x4 的残差块（8 bit） int8_t Dn[4][4]; // DCT变换（整数近似） int16_t Fn[4][4]; for (int i = 0; i < 4; i++) { for (int j = 0; j < 4; j++) { Fn[i][j] = 0; for (int x = 0; x < 4; x++) { for (int y = 0; y < 4; y++) { Fn[i][j] += Dn[x][y] * cos_table[x][i] * cos_table[y][j]; } } Fn[i][j] >>= 1; // 移位代替除以2 } } // 量化 int16_t Qn[4][4]; for (int i = 0; i < 4; i++) { for (int j = 0; j < 4; j++) { Qn[i][j] = round(Fn[i][j] / QScale); } } // 反量化 int16_t Rn[4][4]; for (int i = 0; i < 4; i++) { for (int j = 0; j < 4; j++) { Rn[i][j] = Qn[i][j] * QScale; } } // 逆DCT int8_t Dn_prime[4][4]; for (int x = 0; x < 4; x++) { for (int y = 0; y < 4; y++) { Dn_prime[x][y] = 0; for (int i = 0; i < 4; i++) { for (int j = 0; j < 4; j++) { Dn_prime[x][y] += Rn[i][j] * cos_table[x][i] * cos_table[y][j]; } } Dn_prime[x][y] >>= 1; // 移位代替除以2 } }

注：cos_table 是预计算的余弦表，用于加速DCT/IDCT运算。

六、总结

重点总结：

DCT运算 使用整数近似，避免浮点运算。
量化和 反量化 均为整数操作，使用乘法与移位。
逆DCT 同样使用整数近似。
位宽分析：
Dn: 8 bit
F_n, Q_n, R_n: 16 bit
D'_n: 8 bit

预测值P 为 8 bit，uF'n = D'_n + P 也为 8 bit。

如需进一步了解H.264中Intra4x4预测模式（如DC预测、水平预测、垂直预测等），也可以继续提问！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

H.264 vs H.265
2025-01-22 09:41

Leon_Chenl的博客本文深入浅出介绍了H.264和H.265以及它们的区别，并给出相关选型建议
H.264运动补偿（Motion Compensation）概念（块匹配、运动矢量和残差编码、块划分和运动估计）（运动估计算法：全搜索、钻石搜索、六边形搜索）
2023-12-24 19:14

Dontla的博客 H.264通过运动补偿技术有效地消除了视频帧之间的冗余信息，从而达到了高效的...尽管如此，H.264依然是目前最广泛使用的视频压缩标准之一，其高效的压缩性能和灵活的编码选项使得它在各种应用场景中都有着广泛的应用。
H.264——H.264的基本介绍
2021-04-28 14:54

Spark！的博客目录背景与基本概念特点H.264的应用场景编码整体架构编码结构H.264对一个宏块编码H.264标准采用的编码工具帧内预测帧间预测MV的亚像素差值整数变换与量化无损熵编码其他技术本文是对H.264编码标准研究系列的开端 ...
H.264,H.265,H.266标准技术改进
2025-03-06 14:36

是小果果蛋儿啊的博客 H.265 在 H.264 的基础上大幅提升了压缩效率，尤其适用于高分辨率视频。：在相同质量下，H.266 的比特率比 H.265 再降低 30-50%。H.266 是最新的视频编码标准，进一步提升压缩效率并支持更多应用场景。H.264 是一个...
数字视频编码标准——H.264/AVC视频编码（预测编码，变换编码，熵编码）
2024-04-28 17:10

米粒糊涂了的博客 H.264/AVC标准的方向性（Angular）预测是帧内预测编码中的一种方法，它利用邻近已编码像素的特定方向上的趋势来预测当前宏块中的像素值。H.264/AVC标准的帧内预测编码（Intra Prediction）是一种空间预测技术，它...
H.264编解码技术要点及代码示例
2025-03-15 22:20

智联视频超融合平台的博客 H.264 编解码涉及多个复杂的技术要点，通过上述的代码示例，我们可以对这些技术有一个更直观的理解。需要注意的是，实际的 H.264 编解码实现要复杂得多，还需要考虑更多的细节和优化。智联视频超融合平台通过GB/T...
H.264编码技术介绍
2025-12-14 13:59

jwybobo2007的博客本文深入剖析了H.264/AVC标准的编码技术。从整体编码流程入手，对比了CAVLC与CABAC两种熵编码方式。接着探讨了profile与yuv的关联，以及level级别的计算。在质量参数控制上，详细解读了QP、CQP、CRF、preset等参数的...
H266/VVC 量化编码中量化矩阵 QM 技术
2025-01-24 14:59

码流怪侠的博客 H266/VVC 量化编码中量化矩阵 QM 技术
系统化学习 H264视频编码（03）数据压缩流程及相关概念
2024-07-10 20:15

图王大胜的博客说明：我们参考黄金圈学习法（什么是黄金圈法则?->模型黄金圈法则，本文使用：why-what）来学习音H264视频编码。...H.264数据压缩的目的只有一个，压缩压缩再压缩，减少视频数据大小的同时尽可能地保证图像质量。
H.264编解码程序调试(JM18.6）
2020-08-05 21:35

Geronimo620的博客 H.264介绍 H.264是由ITU-T视频编码专家组（VCEG）和ISO/IEC运动图像专家组（MPEG）联合组成的联合视频组（JVT，Joint Video Team）提出的新一代数字视频压缩标准。与之前的标准一样，同样采用了帧内预测，运动预测...
h264基本知识
2024-11-08 10:45

XHW___001的博客 h264基础知识
【x264】变换量化模块的简单分析
2024-06-13 18:49

东城山的博客变换量化是编码器当中用于节省编码码率的重要操作，其本身应该分为两个部分...变换量化模块处于预测模块之后，用于将预测的残差信息进一步压缩，通过消除图像中的相关性及减小图像编码的动态范围，获得更高的压缩效率。
H.264 入门篇 - 03 (宏块类型)
2022-10-15 18:52

爱洋葱的博客子宏块即 8x8 块，一个16x16的宏块分为4个子宏块，每个子宏块类型表示都是一个8x8块的分割、预测方式，因此，采用子宏块预测的宏块其语法结构中会有4个子宏块类型。MbPartPredMode(mb_type,0) 宏块分割后的第一部分...
H.264 VS H.265 变换编码及量化过程分析（2）
2021-07-19 10:21

biaobiao009的博客量化是视频编码中产生失真的根本原因，它同时影响着编码质量和比特率。 Quantize原理 Quantization parameter and step Quantization在编码中的应用 Quantization在编码中的实现 Quantization在编码中，...
H.264学习笔记4——变换量化
2014-10-15 15:49

Rki-dor的博客　经过帧内（16x16和4x4亮度、8x8色度）和帧间(4x4~16x16亮度、4x4~8x8色度)像素块预测之后，得到预测块的残差，为了压缩残差信息的统计冗余，需要对残差数据进行变换和量化操作。变换和量化的总体操作过程如下图： ...
H.264码流分析
2022-07-10 21:42

ycmzll的博客 H.264码流分析
H.264/AVC原理介绍
2021-05-26 10:14

静思心远的博客 H264原理介绍一.H264框架图1.VCL (VideoCoding ...H.264的功能分两层 VCL (VideoCoding Layer，视频编码层)：负责高效的视频内容表示。 NAL(NetworkAbstraction Layer，网络提取层)：负责以网络所要求的恰当的方式对
H.264 视频编码器变换编码分析
2019-05-30 23:27

Ter23LBJ的博客 H.264 视频编码器变换编码分析 1. 变换编码分为两部分：变换，量化，以及在之后的...采用 Intra4x4 预测模式和 Intra16x16 预测模式得到的亮度分量预测残差，使用4x4离散余弦变换（DCT）；采用 Intra8x8 预测模...
h264编码原理
2024-05-28 21:55

无言cc的博客空间冗余图像相邻像素之间有较强的相关性，比如一帧图像划分成多个 16x16 的块之后，相邻的块很多时候都有比较明显的相似性。2.时间冗余：视频序列的相邻前后帧图像之间内容相似，比如帧率为 25fps 的视频中...
H.264/AVC视频编解码技术
2020-08-21 18:18

涵小呆的博客一、基本概念 ...闭合式GOP：闭合式GOP只需要参考本GOP内的图像即可，不需参考前后GOP的数据。这种模式决定了，闭合式GOP的显示顺序总是以I帧开始以P帧结束开放式GOP：开放式GOP中的B帧解码时可能要用到其前一.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月3日

码龄粉丝数原力等级 --

h.264前端intra4x4交流数据在残差块Dn之后的DCT运算整数公式、量化整数公式、反量化整数公式、逆DCT整数运算公式？

5条回答默认最新

码龄粉丝数原力等级 --

一、基本概念

二、关键公式与算法

1. DCT运算（整数形式）

二维整数DCT变换公式（H.264标准）：

2. 量化公式（整数形式）

3. 反量化公式（整数形式）

4. 逆DCT运算（整数形式）

三、各阶段的位宽分析

四、预测值P与uF'n的位宽

五、代码示例（伪代码）

六、总结

重点总结：

问题事件

码龄粉丝数原力等级 --

h.264前端intra4x4交流数据在残差块Dn之后的DCT运算整数公式、量化整数公式、反量化整数公式、逆DCT整数运算公式？

5条回答 默认 最新

一、基本概念

二、关键公式与算法

1. DCT运算（整数形式）

二维整数DCT变换公式（H.264标准）：

2. 量化公式（整数形式）

3. 反量化公式（整数形式）

4. 逆DCT运算（整数形式）

三、各阶段的位宽分析

四、预测值P与uF'n的位宽

五、代码示例（伪代码）

六、总结

重点总结：

问题事件

5条回答默认最新