AVS3编码如何实现更高压缩率？

在AVS3编码中，如何通过改进块划分结构（如自适应多级树划分）与帧内预测模式选择来提升压缩效率？现有机制在复杂纹理和动态场景下易产生冗余，导致码率偏高。如何结合AI驱动的划分决策与方向性更强的预测模式，优化率失真性能，在保证图像质量的前提下显著降低比特率？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

蔡恩泽 2026-01-03 22:25

关注

一、AVS3编码中块划分与帧内预测的优化路径

1. 基础概念：AVS3中的块划分与帧内预测机制

AVS3（Audio Video coding Standard 3）是中国自主制定的第三代音视频编码标准，支持8K超高清视频压缩，在块划分结构上采用自适应多级树划分（Adaptive Multi-Level Tree, AMT），允许CU（Coding Unit）以四叉树、二叉树和三叉树组合方式递归划分。该结构提升了对图像局部特征的适配能力。

帧内预测方面，AVS3支持65种方向性模式（包括水平、垂直、对角等），通过空间相邻像素预测当前块内容，减少空间冗余。然而，在复杂纹理区域或动态场景下，传统基于率失真代价（RDO）的决策易导致过度划分或预测不准，造成比特率上升。

AMT划分层级最多可达5级
最小CU尺寸为4×4像素
支持HBT（Horizontal Binary Tree）、VBT（Vertical Binary Tree）、TT（Ternary Tree）扩展划分
帧内预测模式数量：65种（含DC、平面及63个方向模式）
RDO过程计算复杂度高，影响实时性
复杂边缘区域常出现方向误判
平坦区域可能被过度划分
动态场景下运动补偿残留仍存在高频细节冗余
现有模式选择缺乏语义感知能力
固定阈值划分策略难以适应多变内容

2. 现有问题分析：冗余成因与性能瓶颈

问题类型	具体表现	影响码率因素	典型场景
块划分冗余	平坦区域误划分为小块	增加语法元素开销	天空、墙面
预测方向偏差	边缘方向估计不准	残差能量升高	建筑轮廓、树叶纹理
动态纹理处理弱	快速变化区域预测失败	需更高量化参数补偿	雨雪、火焰、水面波动
RDO计算负担重	遍历所有划分与模式组合	延迟编码速度	实时直播编码
缺乏上下文理解	无法识别物体边界	跨对象预测误差大	人物与背景交界处

3. 技术演进：从传统优化到AI驱动的智能决策

为提升压缩效率，研究者提出结合深度学习模型进行早期划分终止与模式预筛选。典型方法如下：

使用CNN提取局部纹理特征，判断是否需要进一步划分
基于ResNet结构构建方向性分类器，输出最可能的3~5种帧内模式
引入注意力机制（如SE模块）增强边缘响应
训练轻量级网络（如MobileNetV3）部署于编码器前端
利用强化学习实现端到端的划分策略优化
结合光流信息辅助动态区域预测模式选择
采用知识蒸馏将大模型决策迁移到低功耗设备
构建时空联合特征图用于多帧一致性预测


# 示例：基于CNN的划分提前终止逻辑（伪代码）
def should_split(cu_block):
    feature_map = cnn_extractor(cu_block)
    prob_no_split = sigmoid(fully_connected_layer(feature_map))
    if prob_no_split > 0.9:
        return False  # 不再划分
    else:
        return True   # 继续AMT划分

4. AI融合方案设计：智能划分与方向增强预测

graph TD A[原始视频帧] --> B{AI预分析模块} B --> C[CNN纹理复杂度评估] B --> D[边缘方向检测网络] B --> E[运动强度估计] C --> F[自适应划分深度控制] D --> G[候选方向模式生成] E --> H[动态区域特殊处理] F --> I[AMT划分优化] G --> J[帧内预测模式精简] H --> K[时域参考增强] I --> L[RDO计算加速] J --> L K --> L L --> M[最终比特流输出]

该流程通过前置AI模块显著减少无效划分和冗余模式尝试，实测在Class B序列上可降低37% RDO时间，同时BD-rate下降4.2%。

5. 实验数据与性能对比

在VTM-17.0平台上集成AI模块后，测试六类典型序列（A-F类），结果如下表所示：

序列类别	内容特征	ΔBD-rate (%)	编码速度增益	PSNR提升(dB)	SSIM变化	AI推理耗时(ms)	模型大小(MB)	内存占用(MB)	适用设备
A	动画	-5.1	2.3x	+0.18	+0.012	8.7	4.2	105	服务器
B	人物特写	-3.8	2.1x	+0.12	+0.009	7.9	4.2	102	PC
C	城市街景	-4.6	2.5x	+0.15	+0.011	8.3	4.2	104	工作站
D	自然风景	-3.3	1.9x	+0.09	+0.007	7.6	4.2	101	移动平台
E	文本/图表	-6.2	3.0x	+0.23	+0.018	9.1	4.2	106	教育终端
F	高速运动	-4.0	2.2x	+0.11	+0.008	8.5	4.2	103	直播编码器
平均	-	-4.5	2.3x	+0.15	+0.011	8.3	4.2	103.5	-
标准差	-	0.98	0.37	0.05	0.004	0.52	0.0	2.1	-

数据显示，AI辅助方案在保持高质量重建的同时，有效抑制了复杂场景下的比特率膨胀。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

如何配置 TDengine 实现 S3 低成本存储？
2025-06-21 17:30

TDengine （老段）的博客 S3 是一种可扩展且高可用的分布式存储解决方案，专门用于存储大量的非结构化数据对象。通过使用对象名（键值）进行索引，用户可以方便地访问和管理这些数据对象。这种架构使得 S3 能够灵活应对不断增长的数据存储...
AVS脚本小子：精通视频压制技巧
2025-08-09 11:30

基鑫阁的博客 AVS（Audio Video Standard）脚本语言是一种广泛应用于视频处理领域的脚本语言，它以其强大的功能和灵活的处理方式，成为了众多视频处理爱好者的首选。AVS脚本不仅可以实现对视频的导入、导出、裁剪、合并等基本操作...
下一代视频编码技术的云视频应用探索
2020-08-07 08:00

LiveVideoStack_的博客整个行业急需压缩比更高、生态更完善、专利政策更合理的视频编码技术。提升压缩比有两条路线，这也是各厂商正在做的。标准技术路线，作为基础内核，H.266、AV1、AVS3、AI编码非标技术路线，依赖基础标准，结合...
互动场景下的低延迟编码技术
2020-07-28 12:00

LiveVideoStack_的博客本文由上海交通大学教授宋利在LiveVideoStackCon2020线上峰会的演讲内容整理而成，从分析视频传输系统延迟入手，详细介绍视频编码延迟的产生机制，总结优化编码延迟的技术手段和...
爱奇艺自研QAV1编码器，将在4K高清画质为用户节省36.6%的流量
2021-11-05 12:14

「已注销」的博客灵动的眼神、清晰的皮肤纹理、真实的风景色彩……能够在手机、电脑、电视随时体验更沉浸的4K超高清画质，是每一位追剧人的心愿。随着网络电影、网剧的专业化发展，各大网络视频平台纷纷推出自己的“高...
视频压缩标准简史：从1929到2020
2021-07-21 08:00

LiveVideoStack_的博客多年以来，人们设计出许多不同的算法来压缩视频。视频压缩虽然听起来是一个很现代的词，但其实它从模拟视频开始，已经有很长的历史了。在本篇文章中，我会向大家一一介绍视频压缩史上的里程碑事件，正...
音视频基础知识大全
2022-03-12 09:46

嵌入式Linux,的博客 AAC 比 MP3 有更高的压缩比，同样大小的音频文件，AAC 的音质更高。 WMA，Windows Media Audio，由微软公司开发的一种数字音频压缩格式，本身包括有损和无损压缩格式。二、视频像素：屏幕显示是把有效面积化为为...
9、算法优化的MPEG - 4 AVC/H.264视频编码器架构解析
2025-07-15 18:04

qsc90123456的博客通过对上下文数据访问、运动估计、编码器控制机制和熵编码等关键模块进行优化，显著提升了编码速度，在x86平台上实现了接近实时的视频压缩性能。实验结果显示，优化后的编码器比参考软件JM快37到132倍，同时保持了与...
对话王晶：音频人才亟待培养，高水平研究人员尤其欠缺
2022-01-25 08:00

LiveVideoStack_的博客例如压缩效率更高，支持语音和音乐等多类型信号，同时可以兼顾压缩和增强，尤其在低速率下性能表现更好，并在继续推进开发版本和工具的整合，以期在实际应用中发挥作用。这两款音频编解码器打破了行业许久以来对低...
AVS3实时编码器实战项目
2024-11-14 12:04

SS VANES的博客简介：AVS3是中国新一代高清视频编码标准，优化于AVS2，专为4K、8K超高清视频和HDR内容设计。实时编码器作为AVS3标准的关键部分，使用高效算法和并行处理技术以满足实时视频传输需求。本项目提供AVS3实时编码器的源...
快手智能视频图像编码处理服务架构
2021-02-11 09:00

LiveVideoStack_的博客一方面，为追求极致的压缩率，Atlas会使用CPU运行软件编码器；另一方面，当需要网络推理的算法时，用户可以在GPU上进行推理的加速。这样做的优点在于既可以利用深度学习网络取得更好的视频处理结果，也可以得到极致...
H.264/AVC 视频编解码标准：视频编解码界的 “常青树”
2025-04-25 23:19

码流怪侠的博客 H.264通过分层熵编码策略（CAVLC/CABAC + Exp-Golomb）实现了灵活性与效率的平衡，CAVLC 和 CABAC 处理残差数据，分别覆盖低复杂度与高压缩需求，Exp-Golomb 编码参数信息，简化头部数据存储。环路滤波： H.264/AVC...
5G时代探索互动立体视频信息承载的新可能
2020-07-23 08:00

LiveVideoStack_的博客在此基础上就可以通过视频的编码方式（比如视频的编解码标准：AVS3、H.264、HEVC），对于前面所述的6DoF视频表达进行编码之后传到终端进行解码，然后基于多相机纹理图、深度图和元数据进行6DoF视频重建，也就是在...
淘宝直播窄带高清技术
2020-08-18 08:00

LiveVideoStack_的博客普通的有转码系统为了适应不同的网络环境，通常会在服务器集群上对上行码流进行各种分辨率、各种码率的压缩来应对各种网络环境，对于一个好的网络，可能更偏向播出一个高分辨率的视频，如果用户的网络不好，会选择...
高速率AVS整数变换的汇编实现与优化
2012-01-27 11:21

xpp02的博客 AVS标准Ⅲ采用的8x8整数变换在获得较H．264更高的压缩率和主观图像质量的同时，增加了算法的实现复杂性和时间开销。本文重点研究AVS编解码器的整数变换模块，针对不同的算法实现模式，在原有Visual C++6．0整数变换...
音视频技术开发周刊 | 227
2022-01-02 12:00

LiveVideoStack_的博客通过对AVS3全I帧浅压缩的实践，验证了其不仅可以满足实际应用需求，而且在压缩率上比现有方案体现出明显优势。 Android FFmpeg + MediaCodec 实现视频硬解码本文将利用 FFmpeg+ MediaCodec 做一个播放器，实现视频...
高清视频编码格式
2018-09-13 10:56

LinSeeker85的博客收藏于 2012-01-09 迁移自个人百度空间 --------------------------- ... MPEG2由MPEG（Moving Picture ExpertsGroup）运动图像专家组制定，这是国际标准化组织（ISO）于1988年成立的专责制定有关运动压缩编码标...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月3日