续写视频会议--MPEG-4 标准的视频编码技术介绍

hunter4500 2003-10-02 09:12:18

http://expert.csdn.net/Expert/topic/2275/2275834.xml?temp=.1703455

为了支持基于内容的交互性，即支持对内容独立地进行编、解码，MPEG一4视频检验模型引入了视频对象面（VOP：Video Object Plane）的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域（视频对象面），每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的，且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输，或者编码为一个隔离的视频对象层（VOL：Video Object Layer）。

　　MPEG－4视频编码器的基本结构包括形状编码（对于任意形状的VOS）、运动补偿和基于DCT的纹理编码（采用标准的 8 X 8 DCT或根据形状的自适应DCT）。具体的编码方法为：首先对输入的原图像序列进行场景分析和对象分割，以划分不同的VOP，得到各个VOP的形状和位置信息，它可以用alpha平面来表示。发送端只需传送aleha平面，接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多，需要进行压缩编码。显然，只要对VOP的轮廓进行编码和传送，接收端就可以恢复alpha平面，轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。

　　对运动和纹理信息编码仍然采用经典的类似MPEG-1／2标准的运动预测／补偿法。输入第N帧的VOP与帧存储器中存储的N—1帧的VOP进行比较，找到运动矢量，然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛，以提高编码效率。编码后得到的纹理信息，与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码，形成各自的比特流层，经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

...全文