2、分层B帧以及参考结构的优化 。分层B帧在实现方面不难 , 对压缩效率方面有大的帮助 。前面介绍了GOP结构的优化 , 我们会对参考帧的选择会做权衡 。
3、大家知道在静止场景下 , 分层越多压缩效率越高 , 但在运动场景就不那么有效 , 所以我们实现了自适应的GOP Size , 并自研了Scenecut算法 。能够适应不同运动强度、场景切换的需求包括淡入淡出的需求 。
4.此外 , 在Bi-Search , GPB , LTR这几个工具 , 在开源软件X265是没有的 , 但对提高预测效率很有帮助;MCTF工具对编码噪声的去除非常有帮助 , 我们将这几个技术加入到S265之后获得了5%以上的BD-rate收益 。
5、2-pass是在求解一个全局最优的Qscale , 它在离线转码场景中被用到 , 允许对视频做更多分析 , 但在求解过程中 , 失真度量是MSE , 我们对度量函数进行了重新推导 , 获得5%压缩性能;
6、Dynamic CRF和Pboffset , 常规做法是是固定帧级P , B帧的Offset , 我们会根据帧的复杂度来调节帧级QP值;
7、AQ和RDO的代价计算通常基于MSE , 但如果是针对SSIM指标的话 , 可以推导SSIM的模型 , RD也一样 。
8、针对会议场景 , 我们还实现了IBC工具 , 对PPT投屏有帮助 。并专门设计了对屏幕内容优化的搜索算法 , 传统的快速算法如菱形搜索、六边形搜索在SCC场景下效率很低 , 很难找到最优解 , 但如果用自研的算法搜索就有较好的效率提升 。
上述是S265技术的介绍 , 记得在2016年的时候 , 金山KS265第一次参加MSU比赛获得了非常好的成绩 , 后来国内有不少同行参赛也获得了不错的名次 。阿里巴巴S265从2017年开始投入研究到2020年首次参加MSU比赛 , 我们在比赛中获得了3项第一:1080P 30FPS PNSR指标第一、1080P 1FPS PNSR指标第一、1080P 30FPS主观质量第一 。
2.2 场景自适应编码
除了核心编码器之外 , 在编码器应用方面 , 我们还自研了一套场景自适应编码方法 , 分为三个步骤:
1、视频分析:利用机器学习方法做视频切分 , 并得到高层语义分类 , 比如动画 , 体育 , 秀场 , 商品介绍等;
2、另一个维度看利用信号分析手段检测出视频的底层特征 , 比如运动强度 , 纹理特征 , 噪声强度 , 亮度特征等 , 根据高低维度信息决定编码参数 。
3、自适应决策引擎(ADE):根据语义特征和信号特征以及网络状况 , 决策出最佳编码参数组合 。这个决策过程被建模为一个带约束优化模型;
2.3 S265解码提升覆盖率
一直以来 , H265的解码兼容性是大家关心的话题 , 假如生产端编码出265码流 , 但播放端不能支持265解码 , 需要在服务端转码成264格式 , 这不仅不能减少CDN带宽 , 反而会增加转码成本 。在解码这一侧我们做了很多工作:
1、硬解码适配 。对市面上基本所有机型(>1000款)都进行了适配;
2、自研高性能Native H265解码器 , 在小米5 720P的设备上做测试得到240帧左右的速度 , 通过很低的功耗实现实时解码 。
推荐阅读
- 远程桌面软件有哪些好用 免费手机远程控制软件推荐
- 工程造价预算软件有哪些 免费工程造价软件排名
- 流程图画图工具有哪些 免费流程图制作软件介绍
- 怎样将图片转换成word文档 图片转换成word格式
- lol软件辅助推荐 永久免费脚本辅助工具
- 一休哥图片 一休是真的存在还是杜撰出来的呢
- 一休哥图片 用50字和一张图片证明你是80后
- 金不换图片 农村田野边常见的“土大黄”有什么用途
- 蜘蛛痣图片初期症状 手背出现的红色点点,你知道是什么吗?
- 古代建筑物图片 中国古代至今还在持续使用的建筑有哪些