Deep Multi-Task Learning Based Fast Intra-Mode Decision for Versatile Video Coding

计算机科学 编码(社会科学) 工作流程 人工智能 编码树单元 算法 机器学习 数学 统计 解码方法 数据库
作者
Zheng Liu,Tianyi Li,Ying Chen,Kaijin Wei,Mai Xu,Honggang Qi
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:33 (10): 6101-6116 被引量:15
标识
DOI:10.1109/tcsvt.2023.3262733
摘要

The latest Versatile Video Coding (VVC) standard has significantly coding efficiency improvement compared with its ancestor High Efficiency Video Coding (HEVC) standard, but at the expense of over-high complexity. As measured by the VVC test model (VTM), the intra-mode comparison and selection in the rate-distortion optimization (RDO) search consume most of the encoding time. In this paper, we propose a deep multi-task learning based fast intra-mode decision approach via adaptively pruning off most redundant modes. First, we create a large-scale intra-mode database for VVC, including both normal angular modes and the newly introduced tools, i.e., intra sub-partition (ISP) and matrix-based intra prediction (MIP). Next, we propose a multi-task intra-mode decision network (MID-Net) model to effectively predict the most probable angular modes and whether to skip ISP and MIP modes. Then, a fast intra-coding workflow is designed accordingly, involving rough mode decision (RMD) acceleration and candidate mode list (CML) pruning. For the workflow output, the learning-oriented probability and the statistics-oriented probability are synthesized together to further improve the prediction accuracy, ensuring that only unnecessary intra-modes are skipped. Finally, experimental results show that our approach can significantly reduce 40.48% of encoding time of VVC intra-coding with negligible rate-distortion degradation, outperforming other state-of-the-art approaches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
15完成签到,获得积分10
1秒前
浮梦完成签到,获得积分10
2秒前
李健的小迷弟应助王哈哈采纳,获得10
2秒前
2秒前
天然完成签到,获得积分10
2秒前
情怀应助胡俊豪采纳,获得10
2秒前
8Km完成签到,获得积分10
3秒前
3秒前
1111完成签到,获得积分10
4秒前
kelly发布了新的文献求助10
4秒前
111完成签到 ,获得积分10
4秒前
5秒前
慕青应助十块小子采纳,获得10
6秒前
7秒前
GUI完成签到,获得积分10
7秒前
9668发布了新的文献求助10
9秒前
Something完成签到,获得积分10
9秒前
9秒前
GUI发布了新的文献求助10
10秒前
吴彦祖发布了新的文献求助10
11秒前
小闫同学完成签到 ,获得积分10
12秒前
mochalv123发布了新的文献求助50
12秒前
orixero应助西西采纳,获得10
13秒前
13秒前
jyp111发布了新的文献求助10
14秒前
酷波er应助胡俊豪采纳,获得10
14秒前
森森完成签到,获得积分10
15秒前
温梦花雨完成签到 ,获得积分10
15秒前
情怀应助boblau采纳,获得10
17秒前
18秒前
19秒前
21秒前
科研通AI6.2应助tough_cookie采纳,获得10
22秒前
HSTrigger完成签到,获得积分10
22秒前
1111发布了新的文献求助10
23秒前
里布书发布了新的文献求助10
24秒前
佘佘宇杰发布了新的文献求助10
25秒前
mlsn发布了新的文献求助10
26秒前
凤栖木兮完成签到 ,获得积分10
26秒前
27秒前
高分求助中
论现代体育科学研究的方法学特征 1000
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Petrology and Plate Tectonics 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6915985
求助须知:如何正确求助?哪些是违规求助? 8607196
关于积分的说明 18262441
捐赠科研通 6328312
什么是DOI,文献DOI怎么找? 3068231
关于科研通互助平台的介绍 2096370
邀请新用户注册赠送积分活动 2045608