VisionLab陈彤-全国启智开发者大会高校联动专场论坛-《OpenI海参3.0:基于深度学习的图像智能编码》

Written by  |  11/12/2020 - 18/39

2020年12月3日启智开发者大会上,南京大学电子科学与工程学院Vision实验室博士研究生陈彤参加了由鹏城实验室和OpenI启智社区共同承办的启梦行动高校联动专场论坛,启智社区优秀开源项目代表们受邀分享开源成果和创新理念。OpenI启智社区及其重要成员单位一直致力于为中国的开源开放事业贡献力量,本次启智开发者大会上发布的一项重要项目成果为 “OpenI-启智海参项目V3.0”。在题为《OpenI海参3.0:基于深度学习的图像智能编码》的分享中陈彤表示,期望能够将机器学习的方法和传统图像编码的技术结合起来以寻求一些新的突破。这些开源成果将应用于人工智能产业领域中,致力以技术创新推动中国智造,加快AI时代“提速”发展。人工智能引领的新一轮科技革命和产业变革,正深刻推动着全球产业格局和创新版图的重构。


陈彤-左三

(照片来源: 鹏城实验室公众号)

视频和图像编码技术是数字音频/视频系统中基础的、不可或缺的部分,在过去的三十年中,国际上已经制定了很多代视频和图像编码标准,目前,正在制定新一代的标准。海参项目作为OpenI启智平台首批重点开源项目之一,开源后即受到了广泛关注,吸引了大量开发者参与到智能视频编码的学习与开发中来,推进了海参的技术成熟与产业化发展。本次发布的海参3.0版本旨在探索基于深度神经网络的端到端解决方案,以实现可学习的图像压缩。所提出的方法主要遵循非局部注意力优化和改进的基于上下文建模的图像压缩(NLAIC)的设计,具有混合高斯概率预测的改进的上下文模型。海参3.0在PSNR衡量标准下达到了与当前最新视频编码标准H.266 VVC帧内预测可以匹敌的编码效率,并且在MS-SSIM衡量标准下编码效率要更高于VVC。本次发布的海参3.0版本具有领先的编码效率,能够进一步降低视频传输成本,促进生态良性发展。未来的智能编码领域,基于深度学习的端到端压缩框架将成为主流,海参3.0作为该方向的研究基础,将有力的推进端到端智能编码的技术发展,欢迎开发者们关注并加入海参项目,为智能编码添砖加瓦。