技術(shù)文章
圖像和圖形知識(shí)
閱讀:5942 發(fā)布時(shí)間:2006-4-101.有關(guān)色彩的基本常識(shí)
我們知道,只要是彩色都可用亮度、色調(diào)和飽和度來(lái)描述,人眼中看到的任一彩色光都是這三個(gè)特征的綜合效果。那么亮度、色調(diào)和飽和度分別指的是什么呢?
★ 亮度:是光作用于人眼時(shí)所引起的明亮程度的感覺(jué),它與被觀察物體的發(fā)光強(qiáng)度有關(guān);
★ 色調(diào):是當(dāng)人眼看到一種或多種波長(zhǎng)的光時(shí)所產(chǎn)生的彩色感覺(jué),它反映顏色的種類,是決定顏色的基本特性,如紅色、棕色就是指色調(diào);
★ 飽和度:指的是顏色的純度,即摻入白光的程度,或者說(shuō)是指顏色的深淺程度,對(duì)于同一色調(diào)的彩色光,飽和度越深顏色越鮮明或說(shuō)越純。通常我們把色調(diào)和飽和度通稱為色度。 現(xiàn)在你該明白了,亮度是用來(lái)表示某彩色光的明亮程度,而色度則表示顏色的類別與深淺程度。除此之外,自然界常見(jiàn)的各種顏色光,都可由紅(r)、綠(g)、藍(lán)(b)三種顏色光按不同比例相配而成;同樣絕大多數(shù)顏色光也可以分解成紅、綠、藍(lán)三種色光,這就形成了色度學(xué)中zui基本的原理----三原色原理(rgb)。
2.目前常見(jiàn)的圖形(圖像)格式
一般來(lái)說(shuō),目前的圖形(圖像)格式大致可以分為兩大類:一類為位圖;另一類稱為描繪類、矢量類或面向?qū)ο蟮膱D形(圖像)。前者是以點(diǎn)陣形式描述圖形(圖像)的,后者是以數(shù)學(xué)方法描述的一種由幾何元素組成的圖形(圖像)。一般說(shuō)來(lái),后者對(duì)圖像的表達(dá)細(xì)致、真實(shí),縮放后圖形(圖像)的分辨率不變,在專業(yè)級(jí)的圖形(圖像)處理中運(yùn)用較多。
在介紹圖形(圖像)格式前,我們實(shí)在有必要先了解一下圖形(圖像)的一些相關(guān)技術(shù)指標(biāo):分辨率、色彩數(shù)、圖形灰度。
★ 分辨率:分為屏幕分辨率和輸出分辨率兩種,前者用每英寸行數(shù)表示,數(shù)值越大圖形(圖像)質(zhì)量越好;后者衡量輸出設(shè)備的精度,以每英寸的像素點(diǎn)數(shù)表示;
★ 色彩數(shù)和圖形灰度:用位(bit)表示,一般寫成2的n次方,n代表位數(shù)。當(dāng)圖形(圖像)達(dá)到24位時(shí),可表現(xiàn)1677萬(wàn)種顏色,即真彩?;叶鹊谋硎痉愃?;
下面我們就通過(guò)圖形文件的特征后綴名(就是如圖.bmp這樣的)來(lái)逐一認(rèn)識(shí)當(dāng)前常見(jiàn)的圖形文件格式:bmp、dib、pcp、dif、wmf、gif、jpg、tif、eps、psd、cdr、iff、tga、pcd、mpt。
★ bmp(bit map picture):pc機(jī)上zui常用的位圖格式,有壓縮和不壓縮兩種形式,該格式可表現(xiàn)從2位到24位的色彩,分辨率也可從480x320至1024x768。該格式在windows環(huán)境下相當(dāng)穩(wěn)定,在文件大小沒(méi)有限制的場(chǎng)合中運(yùn)用極為廣泛。
★ dib(device independent bitmap):描述圖像的能力基本與bmp相同,并且能運(yùn)行于多種硬件平臺(tái),只是文件較大。
★ pcp(pc paintbrush):由zsoft公司創(chuàng)建的一種經(jīng)過(guò)壓縮且節(jié)約磁盤空間的pc位圖格式,它zui高可表現(xiàn)24位圖形(圖像)。過(guò)去有一定市場(chǎng),但隨著jpeg的興起,其地位已逐漸日落終天了。
★ dif(drawing interchange formar):autocad中的圖形文件,它以ascii方式存儲(chǔ)圖形,表現(xiàn)圖形在尺寸大小方面十分,可以被coreldraw,3ds等大型軟件調(diào)用編輯。
★ wmf(windows metafile format):microsoft windows圖元文件,具有文件短小、圖案造型化的特點(diǎn)。該類圖形比較粗糙,并只能在microsoft office中調(diào)用編輯。
★ gif(graphics interchange format):在各種平臺(tái)的各種圖形處理軟件上均可處理的經(jīng)過(guò)壓縮的圖形格式。缺點(diǎn)是存儲(chǔ)色彩zui高只能達(dá)到256種。
★ jpg(joint photographics expert group):可以大幅度地壓縮圖形文件的一種圖形格式。對(duì)于同一幅畫(huà)面,jpg格式存儲(chǔ)的文件是其他類型圖形文件的1/10到1/20,而且色彩數(shù)zui高可達(dá)到24位,所以它被廣泛應(yīng)用于internet上的homepage或internet上的圖片庫(kù)。
★ tif(tagged image file format):文件體積龐大,但存儲(chǔ)信息量亦巨大,細(xì)微層次的信息較多,有利于原稿階調(diào)與色彩的復(fù)制。該格式有壓縮和非壓縮兩種形式,zui高支持的色彩數(shù)可達(dá)16m。
★ eps(encapsulated postsc-ript):用postsc-ript語(yǔ)言描述的ascii圖形文件,在postsc-ript圖形打印機(jī)上能打印出高品質(zhì)的圖形(圖像),zui高能表示32位圖形(圖像)。該格式分為photoshop eps格式adobeillustrator eps和標(biāo)準(zhǔn)eps格式,其中后者又可以分為圖形格式和圖像格式。
★ psd(photoshop standard):photoshop中的標(biāo)準(zhǔn)文件格式,專門為photoshop而優(yōu)化的格式。
★ cdr(coreldraw):coreldraw的文件格式。另外,cdx是所有coreldraw應(yīng)用程序均能使用的圖形(圖像)文件,是發(fā)展成熟的cdr文件。
★ iff(image file format):用于大型超級(jí)圖形處理平臺(tái),比如amiga機(jī),好萊塢的特技大片多采用該圖形格式處理。圖形(圖像)效果,包括色彩紋理等逼真再現(xiàn)原景。當(dāng)然,該格式耗用的內(nèi)存外存等的計(jì)算機(jī)資源也十分巨大。
★ tga(tagged graphic):是true vision公司為其顯示卡開(kāi)發(fā)的圖形文件格式,創(chuàng)建時(shí)期較早,zui高色彩數(shù)可達(dá)32位。vda,pix,win,bpx,icb等均屬其旁系。
視頻(動(dòng)畫(huà))
1.動(dòng)態(tài)圖像的組成
動(dòng)態(tài)圖像,包括動(dòng)畫(huà)和視頻信息,是連續(xù)漸變的靜態(tài)圖像或圖形序列,沿時(shí)間軸順次更換顯示,從而構(gòu)成運(yùn)動(dòng)視感的媒體。當(dāng)序列中每幀圖像是由人工或計(jì)算機(jī)產(chǎn)生的圖像時(shí),我們常稱作動(dòng)畫(huà);當(dāng)序列中每幀圖像是通過(guò)實(shí)時(shí)攝取自然景象或活動(dòng)對(duì)象時(shí),我們常成為影像視頻,或簡(jiǎn)稱為視頻。動(dòng)態(tài)圖像演示常常與聲音媒體配合進(jìn)行,二者的共同基礎(chǔ)是時(shí)間連續(xù)性。一般意義上談到視頻時(shí),往往也包含聲音媒體。但在這里,視頻(動(dòng)畫(huà))特制不包含聲音媒體的動(dòng)態(tài)圖像。
2.動(dòng)畫(huà)的定義
什么是動(dòng)畫(huà)?所謂動(dòng)畫(huà),就是通過(guò)以每秒15到20幀的速度(相當(dāng)接近于全運(yùn)動(dòng)視頻幀速)順序地播放靜止圖像幀以產(chǎn)生運(yùn)動(dòng)的錯(cuò)覺(jué)。因?yàn)檠劬δ茏銐蜷L(zhǎng)時(shí)間地保留圖像以允許大腦以連續(xù)的序列把幀連接起來(lái),所以能夠產(chǎn)生運(yùn)動(dòng)的錯(cuò)覺(jué)。我們可以通過(guò)在顯示時(shí)改變圖像來(lái)生成簡(jiǎn)單的動(dòng)畫(huà)。zui簡(jiǎn)單的方法是在兩個(gè)不同幀之間的反復(fù)。這種方法對(duì)于指示"是"或"不是"的情況來(lái)說(shuō)是很好的解決方法。另一種制作動(dòng)畫(huà)的方法是以循環(huán)的形式播放幾個(gè)圖像幀以生成旋轉(zhuǎn)的效果,并且可以依靠計(jì)算時(shí)間來(lái)獲得較好的回放,或用記時(shí)器來(lái)控制動(dòng)畫(huà)。
3.常見(jiàn)的視頻文件格式
視頻信息在計(jì)算機(jī)中存放的格式有很多,目前zui流行的兩種格式是:
蘋果公司的quicktime和微軟的avi。
★ quicktime:是蘋果公司采用的面向zui終用戶桌面系統(tǒng)的低成本、全運(yùn)動(dòng)視頻的方式,現(xiàn)在在軟件壓縮和解壓縮中也開(kāi)始采用這種方式了。其向量量化是quicktime軟件的壓縮技術(shù)之一,它在zui高為30幀/秒下提供的視頻分辨率是320x240,其壓縮率能從25到200。
★ avi:類似于quicktime,是微軟公司采用的音頻視頻交錯(cuò)格式,也是一種桌面系統(tǒng)上的低成本、低分辨率的視頻格式。avi可在160x120的視窗中以15幀/秒回放視頻,并可帶有8位的聲音,也可以在vga或超級(jí)vga監(jiān)視器上回放。avi很重要的一個(gè)特點(diǎn)是可伸縮性,使用avi算法時(shí)的性能依賴于與它一起使用的基礎(chǔ)硬件。
mpeg-4簡(jiǎn)介
mpeg-4是目前業(yè)界*的視頻壓縮技術(shù),具有直覽圖像清晰,傳輸帶寬要求低,遠(yuǎn)程監(jiān)控方便等特點(diǎn)。
mpeg 協(xié)會(huì)創(chuàng)建于1987年。mpeg是motion pictures expert group的縮寫。這個(gè)協(xié)會(huì)是一個(gè)性的機(jī)構(gòu),主要致力于影像壓縮的研究。mpeg-1,用于vcd內(nèi)的壓縮技術(shù),mpeg-2,用于dvd內(nèi)的壓縮技術(shù),以及mp3壓縮方法,都是由這個(gè)協(xié)會(huì)創(chuàng)建的。mpeg的壓縮方式的優(yōu)點(diǎn)除了畫(huà)面質(zhì)量高,帶寬要求低以外,也是在于它是現(xiàn)在數(shù)碼影像屆*的商業(yè)標(biāo)準(zhǔn)。使用mpeg壓縮方式的影像數(shù)據(jù)流可以通過(guò)各類的媒體播放器播放。
以下是mpeg-4與mpeg-1和mpeg-2的比較:
mpeg-1 mpeg-2 mpeg-4
標(biāo)準(zhǔn)創(chuàng)建時(shí)間 1992 1995 1999
zui高圖像分辨率 352 x 288 1920 x 1152 720 x 576
普通pal制式分辨率 352 x 288 720 x 576 720 x 576
普通ntsc制式分辨率 352 x 288 640 x 480 640 x 480
*聲音頻率 48 khz 96 khz 96 khz
zui多聲音通道 2路 8路 8路
zui高數(shù)據(jù)流量 3 mbps 80 mbps 5 to 10 mbps
一般數(shù)據(jù)流量 1380 kbps (352 x 288) 6500 kbps (720 x 576) 880 kbps (720 x 576)
幀每秒(pal) 25 25 25
幀每秒(ntsc) 30 30 30
圖像質(zhì)量 一般 非常好 非常好
編碼硬件要求 低 高 非常高
解碼硬件要求 非常低 中等 高
->監(jiān)控常識(shí)
監(jiān)控系統(tǒng)性能對(duì)比表
比較內(nèi)容 計(jì)算機(jī)數(shù)字壓縮監(jiān)控系統(tǒng) 閉路電視監(jiān)控系統(tǒng) 多媒體監(jiān)控系統(tǒng)
壓縮方式 對(duì)圖像進(jìn)行數(shù)字壓縮 無(wú)圖像數(shù)字壓縮 不對(duì)圖像進(jìn)行數(shù)字壓縮
配 置 在*的計(jì)算機(jī)上集成,設(shè)備簡(jiǎn)潔,可靠性高 由監(jiān)視器、錄像機(jī)、編碼器*、視頻轉(zhuǎn)換器、圖像分割器、矩陣等組成。設(shè)備多、可靠性低 由監(jiān)視器、錄像機(jī)、編碼器*、視頻轉(zhuǎn)換器、圖像分割器、矩陣等組成。設(shè)備多、可靠性低
紀(jì)錄方式 數(shù)字信號(hào) 模擬信號(hào) 模擬信號(hào)
圖 像 由計(jì)算機(jī)顯示器顯示,圖像分辨率達(dá)1024x768, 16位增強(qiáng)色,高分辨率,高清晰度,高畫(huà)質(zhì) 采用監(jiān)視器顯示,掃描線分辨率為300線 可由計(jì)算機(jī)顯示器顯示分辨率可達(dá)1204x768或由顯示器顯示分辨率為300線
傳 輸 可通過(guò)普通線遠(yuǎn)距離傳輸圖形信號(hào),傳輸速度率為5/幀秒,且能保證圖像質(zhì)量 不能遠(yuǎn)距離傳輸 可進(jìn)行單幀傳輸
安 全 系統(tǒng)智能化,自動(dòng)登陸每一個(gè)進(jìn)入系統(tǒng)的人員,有多個(gè)安全防范等級(jí),能有效的防范內(nèi)部人員作案 任何人都可進(jìn)入系統(tǒng)而不被紀(jì)錄,不能防范內(nèi)部人員作案 不能對(duì)每個(gè)進(jìn)入系統(tǒng)的人進(jìn)行安全檢測(cè),不能防范內(nèi)部人員作案
系 統(tǒng) 采用計(jì)算機(jī)中文視窗win2000操作平臺(tái),可支持各種軟、硬件的擴(kuò)展,隨著計(jì)算機(jī)升級(jí)而升級(jí) 系統(tǒng)一經(jīng)配套組合,便不可升級(jí) 系統(tǒng)一經(jīng)配套組合,便不可升級(jí)
操 作 操作簡(jiǎn)單到只要一按電源開(kāi)關(guān)即可,全自動(dòng)進(jìn)入監(jiān)視狀態(tài) 需要開(kāi)啟每一臺(tái)設(shè)備的電源,并設(shè)置每一設(shè)備的參數(shù)后,方可工作 需要開(kāi)啟每一臺(tái)設(shè)備的電源,并設(shè)置每一設(shè)備的參數(shù)后,方可工作
值 守 可無(wú)人值守 根據(jù)系統(tǒng)大小,需多人值守 根據(jù)系統(tǒng)大小,需多人值守
功 耗 150w-500w 500w-3000w 500w-3000w
錄 制 可多個(gè)硬盤循環(huán)錄制 磁帶更換錄制 不能循環(huán)錄制
回 放 可單幀畫(huà)面回放檢索即連續(xù)回放,畫(huà)面質(zhì)量可靠 只能利用錄像機(jī)暫停鍵查看畫(huà)面,畫(huà)面質(zhì)量差 可單幀畫(huà)面回放或利用錄像機(jī)暫停鍵查看畫(huà)面
檢 索 多檢索點(diǎn),可根據(jù)文件類型攝像機(jī)型號(hào)及文件的年月日時(shí)分秒進(jìn)行所要的畫(huà)面檢索 需耗費(fèi)很多時(shí)間自在錄像帶上反復(fù)進(jìn)退查找確定時(shí)刻的畫(huà)面內(nèi)容,對(duì)某一時(shí)刻進(jìn)行檢索難度大,偶然性強(qiáng) 檢索方式略多于模擬紀(jì)錄方式
編 輯 支持多種軟件,可對(duì)圖像的每一幀畫(huà)面進(jìn)行多次編輯、修復(fù)、打印 不能編輯、修復(fù)、打印 可對(duì)圖像的每一幀畫(huà)進(jìn)行多次編輯、修復(fù)、打印
圖像校正 計(jì)算機(jī)軟件可調(diào)整圖像清晰度\對(duì)比度、亮度及色度等 不能做任何校正 可部分調(diào)整圖像清晰度對(duì)比度亮度及色度等
報(bào) 警 智能報(bào)警,即可將報(bào)警后的圖像錄入,也可將報(bào)警前的內(nèi)容錄下來(lái) 只能錄下報(bào)警后的內(nèi)容 可將報(bào)警后的的內(nèi)容,也可將報(bào)警前的內(nèi)容自動(dòng)錄入
維 修 無(wú)需拆機(jī)維護(hù),經(jīng)培訓(xùn)后普通保安人員即可進(jìn)行維護(hù) 對(duì)系統(tǒng)中的每一部分都必須專人定期保養(yǎng)維護(hù),如:清潔錄像機(jī)磁頭、保存錄像帶等 對(duì)系統(tǒng)中的每一部分都必須專人定期保養(yǎng)維護(hù)
占用空間
相當(dāng)于pc機(jī)的體積,占用空間很小 設(shè)備及連線復(fù)雜,占用空間較大 設(shè)備及連線復(fù)雜,占用空間較大
價(jià) 格 經(jīng)濟(jì),原有設(shè)備不至浪費(fèi),免費(fèi)升級(jí)軟件,可在相當(dāng)長(zhǎng)的時(shí)間內(nèi)不被淘汰 設(shè)備投資大,維修費(fèi)用高,且無(wú)升級(jí)潛力 設(shè)備投資大,維修費(fèi)用高,且無(wú)升級(jí)潛力
多媒體數(shù)據(jù)壓縮和編碼技術(shù)標(biāo)準(zhǔn)
目前,被社會(huì)廣泛認(rèn)可和應(yīng)用的通用壓縮編碼標(biāo)準(zhǔn)大致有如下四種:
h.261、jpeg、 mpeg和dvi。
★ h.261:由ccitt(電報(bào)咨詢委員會(huì))通過(guò)的用于音頻視頻服務(wù)的視頻編碼*(也稱px64標(biāo)準(zhǔn)),它使用兩種類型的壓縮:一幀中的有損壓縮(基于dct)和用于幀間壓縮的無(wú)損編碼,并在此基礎(chǔ)上使編碼器采用帶有運(yùn)動(dòng)估計(jì)的dct和dpcm(差分脈沖編碼調(diào)制)的混合方式。這種標(biāo)準(zhǔn)與jpeg及mpeg標(biāo)準(zhǔn)間有明顯的相似性,但關(guān)鍵區(qū)別是它是為動(dòng)態(tài)使用設(shè)計(jì)的,并提供*包含的組織和高水平的交互控制。
★ jpeg:全稱是joint photogragh coding experts group(聯(lián)合照片專家組),是一種基于dct的靜止圖像壓縮和解壓縮算法,它由iso(標(biāo)準(zhǔn)化組織)和ccitt(電報(bào)咨詢委員會(huì))共同制定,并在1992年后被廣泛采納后成為標(biāo)準(zhǔn)。它是把冗長(zhǎng)的圖像信號(hào)和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個(gè)級(jí)別上,圖像的質(zhì)量并不好;壓縮比為20:1時(shí),能看到圖像稍微有點(diǎn)變化;當(dāng)壓縮比大于20:1時(shí),一般來(lái)說(shuō)圖像質(zhì)量開(kāi)始變壞。
★ mpeg:是moving pictures experts group(動(dòng)態(tài)圖像專家組)的英文縮寫,實(shí)際上是指一組由itu和iso制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標(biāo)準(zhǔn)。它采用的是一種減少圖像冗余信息的壓縮算法,它提供的壓縮比可以高達(dá)200:1,同時(shí)圖像和音響的質(zhì)量也非常高?,F(xiàn)在通常有三個(gè)版本:mpeg-1、mpeg-2、mpeg-4以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。它的三個(gè)zui顯著優(yōu)點(diǎn)就是兼容性好、壓縮比高(zui高可達(dá)200:1)、數(shù)據(jù)失真小。
★ dvi:其視頻圖像的壓縮算法的性能與mpeg-1相當(dāng),即圖像質(zhì)量可達(dá)到vhs的水平,壓縮后的圖像數(shù)據(jù)率約為1.5mb/s。為了擴(kuò)大dvi技術(shù)的應(yīng)用,in公司zui近又推出了dvi算法的軟件解碼算法,稱為indeo技術(shù),它能將為壓縮的數(shù)字視頻文件壓縮為五分之一到十分之一。
說(shuō)到mpeg,相信沒(méi)有哪位朋友會(huì)不知道,但要追根究底地問(wèn)你mpeg到底是什么,恐怕就沒(méi)有多少人能正確地回答出來(lái)了。實(shí)際上,mpeg的全稱應(yīng)該是moving pictures experts group(即動(dòng)態(tài)圖像專家組),由iso(international standards organization,標(biāo)準(zhǔn)化組織)與iec(international electronic committee)于1988年聯(lián)合成立,致力于運(yùn)動(dòng) 圖像(mpeg視頻)及其伴音編碼(mpeg音頻)標(biāo)準(zhǔn)化工作。
mpeg共有4個(gè)版本,其中前兩個(gè)版本mpeg-1和mpeg-2應(yīng)用比較廣泛,而mpeg-4雖然已推出近兩年,但有關(guān)它的應(yīng)用卻直到zui近才活躍起來(lái),mpeg-7則是屬于未來(lái)的標(biāo)準(zhǔn)。今天,我們就在了解mpeg這個(gè)家庭的成長(zhǎng)歷程和各個(gè)成員的特點(diǎn)的基礎(chǔ)上,重點(diǎn)看看mpeg-4的特點(diǎn)和應(yīng)用,相信在不久,大家就會(huì)廣泛地接觸到采用mpeg-4這種*技術(shù)制作的產(chǎn)品。
廣泛應(yīng)用的mpeg-1與mpeg-2
mpeg-1標(biāo)準(zhǔn)(iso/iec11172)制定于1992年,是針對(duì)1.5mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音編碼設(shè)計(jì)的標(biāo)準(zhǔn),主要用于在cd-rom(包括video-cd、cd-i等)存儲(chǔ)彩色的同步運(yùn)動(dòng)視頻圖像,它針對(duì)sif(標(biāo)準(zhǔn)交換格式)標(biāo)準(zhǔn)分辨率(ntsc制為352×240;pal制為352×288)的圖像進(jìn)行壓縮,每秒可播放30幀畫(huà)面,具備cd(指激光唱盤)音質(zhì)。同時(shí),它還被用于網(wǎng)絡(luò)上的視頻傳輸,如非對(duì)稱數(shù)字用戶線路(adsl)、視頻點(diǎn)播(vod)、教育網(wǎng)絡(luò)等。
使用mpeg-1的壓縮算法,可以將一部120分鐘長(zhǎng)的電影壓縮到1.2gb左右,因此,它被廣泛地應(yīng)用于vcd制作和一些視頻片段的下載,目前90%以上的vcd都是用mpeg-1格式壓縮的。
mpeg-2標(biāo)準(zhǔn)iso/iec13818)制定于1994年,是針對(duì)3~10mbps的數(shù)據(jù)傳輸率制定的的運(yùn)動(dòng)圖像及其伴音編碼的標(biāo)準(zhǔn)。mpeg-2可以提供一個(gè)較廣的范圍改變壓縮比,以適應(yīng)不同畫(huà)面質(zhì)量、存儲(chǔ)容量和帶寬的要求。它在與mpeg-1兼容的基礎(chǔ)上實(shí)現(xiàn)了低碼率和多聲道擴(kuò)展:mpeg-2可以將一部120分鐘長(zhǎng)的電影壓縮到4~8gb(它提供的是我們通常所說(shuō)的dvd品質(zhì)),其音頻編碼可提供左右中及兩個(gè)環(huán)繞聲道、一個(gè)加重低音聲道和多達(dá)7個(gè)伴音聲道(因此dvd可有8種語(yǔ)言配音)。
除了作為dvd的標(biāo)準(zhǔn)外,mpeg-2還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)等提供廣播級(jí)的數(shù)字視頻。不過(guò)對(duì)普通用戶來(lái)說(shuō),由于現(xiàn)在電視機(jī)分辨率的限制,mpeg-2所帶來(lái)的高清晰度畫(huà)面質(zhì)量(如dvd畫(huà)面)在電視上效果并不明顯,倒是其音頻特性(如加重低音、多伴音聲道等)得到了廣泛的應(yīng)用。
mpeg-3是iso/ieczui初為hdtv(高清晰電視廣播)制定的編碼和壓縮標(biāo)準(zhǔn),但由于mpeg-2的出色性能已能適用于hdtv,因此mpeg-3標(biāo)準(zhǔn)并未制定,我們通常所說(shuō)的mp3指的是mpeg layer 3,只是mpeg的一個(gè)音頻壓縮標(biāo)準(zhǔn)。
令人稱道的mpeg-4
mpeg-4于1998年11月公布,預(yù)計(jì)投入使用的標(biāo)準(zhǔn)mpeg-4是針對(duì)一定比特率下的視頻、音頻編碼,更加注重多媒體系統(tǒng)的交互性和靈活性。為此,mpeg-4引入了av對(duì)象(audio/visual ob-jects),使得更多的交互操作成為可能:
"av對(duì)象"可以是一個(gè)孤立的人,也可以是這個(gè)人的語(yǔ)音或一段背景音樂(lè)等。它具有編碼、存儲(chǔ)與傳播及可交互操作的特性。
mpeg-4對(duì)av對(duì)象的操作主要有:采用av對(duì)象來(lái)表示聽(tīng)覺(jué)、視覺(jué)或者視聽(tīng)組合內(nèi)容;組合已有的av對(duì)象來(lái)生成復(fù)合的av對(duì)象,并由此生成av場(chǎng)景;對(duì)av對(duì)象的數(shù)據(jù)靈活地多路合成與同步,以便選擇合適的網(wǎng)絡(luò)來(lái)傳輸這些av對(duì)象數(shù)據(jù);允許接收端的用戶在av場(chǎng)景中對(duì)av對(duì)象進(jìn)行交互操作等。
mpeg-4標(biāo)準(zhǔn)則由6個(gè)主要部分構(gòu)成:
1、dmif(the deliveries multimedia integration framework,多媒體傳送整體框架)。主要用于解決交互網(wǎng)絡(luò)中、廣播環(huán)境下以及磁盤應(yīng)用中多媒體應(yīng)用的操作問(wèn)題。通過(guò)傳輸多路合成比特信息來(lái)建立客戶端和服務(wù)器端的連接與傳輸。
2、數(shù)據(jù)平面。為了使基本流和av對(duì)象在同一場(chǎng)景中出現(xiàn),mpeg-4引用了對(duì)象描述(od)和流圖桌面(smt)的概念。od傳輸與特殊av對(duì)象相關(guān)的基本流的信息流圖。桌面把每一個(gè)流與一個(gè)cat(channel association tag)相連,cat可實(shí)現(xiàn)該流的順利傳輸。
3、緩沖區(qū)管理和實(shí)時(shí)識(shí)別。mpeg-4定義了一個(gè)系統(tǒng)解碼模式(sdm),該解碼模式描述了一種理想的處理比特流句法語(yǔ)義的解碼裝置,它要求特殊的緩沖區(qū)和實(shí)時(shí)模式。通過(guò)有效地管理,可以更好地利用有限的緩沖區(qū)空間。
4、音頻編碼。mpeg-4不僅支持自然聲音,而且支持合成聲音。mpeg-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對(duì)象特征。
5、視頻編碼。與音頻編碼類似,mpeg-4也支持對(duì)自然和合成的視覺(jué)對(duì)象的編碼。合成的視覺(jué)對(duì)象包括2d、3d動(dòng)畫(huà)和人面部表情動(dòng)畫(huà)等。
6、場(chǎng)景描述。mpeg-4提供了一系列工具,用于組成場(chǎng)景中的一組對(duì)象。一些必要的合成信息組成場(chǎng)景描述,用于描述各av對(duì)象在一具體av場(chǎng)景坐標(biāo)下,如何組織與同步等問(wèn)題。
mpeg-4的應(yīng)用
與mpeg-1和mpeg-2相比,mpeg-4更適于交互av服務(wù)以及遠(yuǎn)程監(jiān)控,它的設(shè)計(jì)目標(biāo)使其具有更廣的適應(yīng)性和可擴(kuò)展性: mpeg-4傳輸速率在4800-64000bps之間,分辨率為176×144,可以利用很窄的帶寬通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù),從而能以zui少的數(shù)據(jù)獲得*的圖像質(zhì)量。因此,它將在數(shù)字電視、動(dòng)態(tài)圖像、互聯(lián)網(wǎng)、實(shí)時(shí)多媒體監(jiān)控、移動(dòng)多媒體通信、internet/intranet上的視頻流與可視游戲、dvd上的交互多媒體應(yīng)用等方面大顯身手。
當(dāng)然,對(duì)于普通用戶來(lái)說(shuō),mpeg-4在目前來(lái)說(shuō)zui有吸引力的地方還在于它能在普通cd-rom上基本實(shí)現(xiàn)dvd的質(zhì)量:用mpeg-4 壓縮算法的asf(advanced streaming format,格式流)可以將120分鐘的電影壓縮為300mb左右的視頻流;采用mpeg-4壓縮算法的divx 視頻編碼技術(shù)可以將120分鐘的電影壓縮600mb左右,也可以將一部 dvd影片壓縮到 2 張 cd-rom上!也就是說(shuō),有了mpeg-4,你不需要購(gòu)買 dvd-rom 就可以享受到和它差不多的視頻質(zhì)量!播放這種編碼的影片對(duì)機(jī)器的要求并不高:只要你的電腦有300mhz 以上(無(wú)論是哪種型號(hào))的cpu、64mb內(nèi)存、8mb的顯卡就可以流暢地播放。
不過(guò),和dvd相比,mpeg-4屬于一種高比率有損壓縮算法,其圖像質(zhì)量始終無(wú)法和dvd的mpeg-2相比,畢竟dvd的存儲(chǔ)容量比較大。此外,要想保證高速運(yùn)動(dòng)的圖像畫(huà)面不失真,必須有足夠的碼率,目前mpeg-4的碼率雖然可以調(diào)到和dvd差不多,但總體效果還有不小的差距。因此,現(xiàn)在的mpeg-4只能面向娛樂(lè)、欣賞方面的市場(chǎng),那些對(duì)圖像質(zhì)量要求較高的專業(yè)視頻領(lǐng)域暫時(shí)還不能采用。
屬于未來(lái)的mpeg-7
繼mpeg-4之后,要解決的矛盾就是對(duì)日漸龐大的圖像、聲音信息的管理和迅速搜索。1998年10月基于這種設(shè)想的mpeg-7標(biāo)準(zhǔn)被提出,它的正式名稱是"多媒體內(nèi)容描述接?quot;,將對(duì)各種不同類型的多媒體信息進(jìn)行標(biāo)準(zhǔn)化的描述,并將該描述與所描述的內(nèi)容相,以實(shí)現(xiàn)快速有效的搜索。
由于該標(biāo)準(zhǔn)不包括對(duì)描述特征的自動(dòng)提取,它也沒(méi)有規(guī)定利用描述進(jìn)行搜索的工具或任何程序,因此,它可以獨(dú)立于其他mpeg標(biāo)準(zhǔn)使用,但mpeg-4中所定義的對(duì)音頻、視頻對(duì)象的描述仍然適用于mpeg-7,這種描述是分類的基礎(chǔ)。我們可以也利用mpeg-7的描述來(lái)增強(qiáng)其他mpeg標(biāo)準(zhǔn)的功能。
mpeg-7的應(yīng)用范圍很廣泛,既可應(yīng)用于存儲(chǔ)(在線或離線),也可用于流式應(yīng)用(如廣播、將模型加入internet等)。它還可以在實(shí)時(shí)或非實(shí)時(shí)環(huán)境下應(yīng)用,如:數(shù)字圖書(shū)館(圖像目錄、音樂(lè)字典等)、多媒體名錄服務(wù)(如黃頁(yè))、廣播媒體選擇(無(wú)線電信道,t道等)等。它在未來(lái)將會(huì)在教育、新聞、導(dǎo)游信息、娛樂(lè)、等各方面將發(fā)揮巨大的作用。
mpeg-1的出現(xiàn)使vcd取代了錄像帶,mpeg-2的出現(xiàn)使數(shù)字電視逐步取代模擬電視,mpeg-4的出現(xiàn)使多媒體系統(tǒng)的交互性和靈活性大為增強(qiáng),而mpeg-7的出現(xiàn)將會(huì)帶我們進(jìn)入一個(gè)互動(dòng)多媒體的網(wǎng)絡(luò)時(shí)代。
智能制造網(wǎng)