常用的编号方法 编号格式是什么意思( 二 )


PCM(脉冲编码调制)是一种将模拟语音信号变换为数字信号的编码方式 。主要经过3个过程:抽样、量化和编码 。抽样过程将连续时间模拟信号变为离散时间、连续幅度的抽样信号,量化过程将抽样信号变为离散时间、离散幅度的数字信号,编码过程将量化后的信号编码成为一个二进制码组输出 。
量化分为线性量化和非线性量化 。线性量化在整个量化范围内,量化间隔均相等 。非线性量化采用不等的量化间隔 。量化间隔数由编码的二进制位数决定 。例如,CD采用16bit线性量化,则量化间隔数L=65536 。位数(n)越多,精度越高,信噪比SNR=6.02n+1.76(dB)也越高 。但编码的二进制位数不是无限制的,需要根据所需的数据率确定 。比如:CD可以达到的数据率为2×44.1×16=1411.2Kbit/s 。
简单的理解,LPCM就是把原始模拟声音波形经过采样和线性量化后得到的数字信号,这些数据信号还没被压缩 。
G711G711是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-code modulation)抽样标准,主要用于电话 。它主要用脉冲编码调制对音频采样,采样率为8k每秒 。它利用一个 64Kbps 未压缩通道传输语音讯号 。起压缩率为1:2,即把16位数据压缩成8位 。G.711是主流的波形声音编解码器 。
G.711 标准下主要有两种压缩算法 。一种是u-law algorithm (又称often u-law, ulaw, mu-law),主要运用于北美和日本;另一种是A-law algorithm,主要运用于欧洲和世界其他地区 。其中,后者是特别设计用来方便计算机处理的
G711的内容是将14bit(uLaw)或者13bit(aLaw)采样的PCM数据编码成8bit的数据流,播放的时候在将此8bit的数据还原成14bit或者13bit进行播放,不同于MPEG这种对于整体或者一段数据进行考虑再进行编解码的做法,G711是波形编解码算法,就是一个sample对应一个编码,所以压缩比固定为:
8/14 = 57% (uLaw)
8/13 = 62% (aLaw)
简单理解,G.711就是语音模拟信号的一种非线性量化,bitrate 是64kbps 。
AACAAC,全称Advanced Audio Coding,中文名:高级音频编码,是一种专为声音数据设计的文件压缩格式 。与MP3不同,它采用了全新的算法进行编码,更加高效,具有更高的“性价比” 。利用AAC格式,可使人感觉声音质量没有明显降低的前提下,更加小巧 。苹果ipod、诺基亚手机支持AAC格式的音频文件 。
优点:相对于mp3,AAC格式的音质更佳,文件更小 。
不足:AAC属于有损压缩的格式,与时下流行的APE、FLAC等无损格式相比音质存在“本质上”的差距 。加之,传输速度更快的USB3.0和16G以上大容量MP3正在加速普及,也使得AAC头上“小巧”的光环不复存在 。
AAC是新一代的音频有损压缩技术,它通过一些附加的编码技术(比如PS,SBR等),衍生出了LC-AAC,HE-AAC,HE-AACv2三种主要的编码,LC-AAC就是比较传统的AAC,相对而言,主要用于中高码率(>=80Kbps),HE-AAC(相当于AAC+SBR)主要用于中低码(<=80Kbps),而新近推出的HE-AACv2(相当于AAC+SBR+PS)主要用于低码率(<=48Kbps),事实上大部分编码器设成<=48Kbps自动启用PS技术,而>48Kbps就不加PS,就相当于普通的HE-AAC 。
格式对比

常用的编号方法 编号格式是什么意思



常用的编号方法 编号格式是什么意思


C++音视频开发学习资料:点击→音视频开发(资料文档+视频教程+面试题)(FFmpeg+WebRTC+RTMP+RTSP+HLS+RTP)
常用的编号方法 编号格式是什么意思


音频帧长其实,音频的帧的概念没有视频帧那么清晰,几乎所有视频编码格式都可以简单的认为一帧就是编码后的一副图像 。但音频帧跟编码格式相关,它是各个编码标准自己实现的 。因为如果以PCM(未经编码的音频数据)来说,它根本就不需要帧的概念,根据采样率和采样精度就可以播放了 。

推荐阅读