有口皆碑的MPEG-4
MPEG-4于1998年11月公布,預(yù)計投入使用的國際標(biāo)準(zhǔn)MPEG-4是針對一定比特率下的視頻、音頻編碼,更加注重的是多媒體系統(tǒng)的交互性和靈活性。為此,MPEG-4引入了AV對象(Audio/Visual Objects),使得更多的交互操作成為可能:
“AV對象”可以是一個孤立的人,也可以是這個人的語音或一段背景音樂等。它具有高效編碼、高效存儲與傳播及可交互操作的特性。
MPEG-4對AV對象的操作主要有:采用AV對象來表示聽覺、視覺或者視聽組合內(nèi)容;組合已有的AV對象來生成復(fù)合的AV對象,并由此生成AV場景;對AV對象的數(shù)據(jù)靈活地多路合成與同步,以便選擇合適的網(wǎng)絡(luò)來傳輸這些AV對象數(shù)據(jù);允許接收端的用戶在AV場景中對AV對象進行交互操作等。
MPEG-4標(biāo)準(zhǔn)則由6個主要部分構(gòu)成:
。、DMIF(The Deliveries Multimedia Integration Framework,多媒體傳送整體框架)。主要用于解決交互網(wǎng)絡(luò)中、廣播環(huán)境下以及磁盤應(yīng)用中多媒體應(yīng)用的操作問題。通過傳輸多路合成信息來建立客戶端和服務(wù)器端的連接與傳輸。
2、數(shù)據(jù)平面。
。、緩沖區(qū)管理和實時識別。MPEG-4定義了一個系統(tǒng)解碼模式,該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置,它要求特殊的緩沖區(qū)和實時模式。通過有效地管理,可以更好地利用有限的緩沖區(qū)空間。
4、音頻編碼。MPEG-4不僅支持自然聲音,而且支持合成聲音。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對象特征。
。、視頻編碼。與音頻編碼類似,MPEG-4也支持對自然和合成的視覺對象的編碼。合成的視覺對象包括二維、三維動畫和人面部表情動畫等。
6、場景描述。MPEG-4提供了一系列工具,用于組成場景中的一組對象。一些必要的合成信息組成場景描述,用于描述各AV對象在一具體AV場景坐標(biāo)下,如何組織與同步等問題。
[上一頁] [下一頁]
|