续写 视频会议--MPEG-4 标准的视频编码技术介绍
http://expert.csdn.net/Expert/topic/2275/2275834.xml?temp=.1703455
为了支持基于内容的交互性,即支持对内容独立地进行编、解码,MPEG一4视频检验模型引入了视频对象面(VOP:Video Object Plane)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL:Video Object Layer)。
MPEG-4视频编码器的基本结构包括形状编码(对于任意形状的VOS)、运动补偿和基于DCT的纹理编码(采用标准的 8 X 8 DCT或根据形状的自适应DCT)。具体的编码方法为:首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息,它可以用alpha平面来表示。发送端只需传送aleha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。
对运动和纹理信息编码仍然采用经典的类似MPEG-1/2标准的运动预测/补偿法。输入第N帧的VOP与帧存储器中存储的N—1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。