聲音其實是一種能量波,因此也有頻率和振幅的特征,頻率對應于時間軸線,振幅對應于電平軸線。我們知道,在可聽見的聲音中,話音信號的頻段在80Hz到3400Hz之間,音樂信號的頻段在20Hz-20kHz之間,語音(話音)和音樂是多媒體技術重點處理的對象。通常人耳可以聽到的頻率在20Hz到20KHz的聲波稱為為可聽聲,低于20Hz的成為次聲,高于20KHz的為超聲,多媒體技術中只研究可聽聲部分。
一:數字化音頻的三個主要步驟
由于模擬聲音在時間上是連續的,麥克風采集的聲音信號還需要經過數字化處理后才能由計算機處理。通常我們采用PCM編碼(脈沖代碼調制編碼),即通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。
1、采樣
采樣,就是每隔一段時間間隔讀一次聲音的幅度。單位時間內采樣的次數稱為采樣頻率。顯然采樣頻率越高,所得到的離散幅值的數據點就越逼近于連續的模擬音頻信號曲線,同時采樣的數據量也越大。
為了保證數字化的音頻能夠準確(可逆)地還原成模擬音頻進行輸出,采樣定理要求:采樣頻率必須大于等于模擬信號頻譜中的最高頻率的2倍。
常用的音頻采樣率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
例如:話音信號頻率在0.3~3.4kHz范圍內,用8kHz的抽樣頻率(fs),就可獲得能取代原來連續話音信號的抽樣信號,而一般CD采集采樣頻率為44.1kHz。
2、量化
量化,就是把采樣得到的聲音信號幅度轉換成數字值,用于表示信號強度。
量化精度:用多少個二進位來表示每一個采樣值,也稱為量化位數。聲音信號的量化位數一般是 4,6,8,12或16 bits 。
由采樣頻率和量化精度可以知道,相對自然界的信號,音頻編碼最多只能做到無限接近,在計算機應用中,能夠達到最高保真水平的就是PCM編碼,通常PCM約定俗成了無損編碼。
3、編碼
一個采樣率為44.1kHz,量化精度為16bit,雙聲道的PCM編碼輸出,它的數據速率則為 44.1K×16×2 =1411.2 Kbps,存儲一秒鐘需要176.4KB的空間,1分鐘則約為10.34M,因此,為了降低傳輸或存儲的費用,就必須對數字音頻信號進行編碼壓縮。
到目前為止,音頻信號經壓縮后的數碼率降低到32至256kbit/s,語音可以低至8kbit/s以下。
對數字音頻信息的編碼進行壓縮的目的是在不影響人們使用的情況下使數字音頻信息的數據量最少。通常用如下6個屬性來衡量:
—比特率;
—信號的帶寬;
—主觀/客觀的語音質量;
—延遲;
—計算復雜度和對存儲器的要求;
—對于通道誤碼的靈敏度;
為使編碼后的音頻信息可以被廣泛地使用,在進行音頻信息編碼時需要采用標準的算法。傳統會議電視設備主要采用ITU-T推薦的G.711、G.722、G.728和AAC_LD等音頻標準。
在音頻設備的介紹里面會經常看到產品資料里有各式各樣所支持的音頻格式和協議,下面我們來詳細講解下藍牙耳機、會議電視的常用音頻協議。
藍牙耳機常用音頻協議有哪些

HFP:HFP(Hands-free Profile),讓藍牙設備可以控制電話,如接聽、掛斷、拒接、語音撥號等,拒接、語音撥號要視藍牙耳機及電話是否支持。汽車內的汽車套件是常見的使用情景。汽車套件將連接至手機并用于撥打和接聽電話。將無線耳機連接至手機后使用耳機撥打和接聽電話則更為常見。
HSP:耳機模式(HSP)用于支持藍牙耳機與移動電話之間使用免提模式(HFP)常用來讓車用免提溝通與車內移動電話
A2DP:A2DP全名是Advanced Audio Distribution Profile 藍牙音頻傳輸模型協定! A2DP是能夠采用耳機內的芯片來堆棧數據,達到聲音的高清晰度。然而并非支持A2DP的耳機就是蘭阿姨耳機立體聲,立體聲實現的基本要求是雙聲道,所以單聲道的藍牙耳機是不能實現立體聲的。聲音能達到44.1kHz,一般的耳機只能達到8kHz。如果手機支持藍牙,只要裝載A2DP協議,就能使用A2DP耳機了。還有消費者看到技術參數提到藍牙V1.0 V1.1 V1.2 V2.0——這些是指藍牙的技術版本,是指通過藍牙傳輸的速度,他們是否支持A2DP具體要看藍牙產品制造商是否使用這個技術。
AVRCP:AVRCP 設計用于提供控制TV、Hi-Fi設備等的標準接口。此配置文件用于許可單個遠程控制設備(或其它設備)控制所有用戶可以接入的A/V設備。它可以與 A2DP 或 VDP 配合使用。AVRCP 定義了如何控制流媒體的特征。包括暫停、停止、啟動重放、音量控制及其它類型的遠程控制操作。AVRCP 定義了兩個角色,即控制器和目標設備。
APTX:AptX是一種壓縮技術,好比是ALAC,本身是支持無損的,但是被用在藍牙技術中的時候,由于種種原因,還是有損,只不過屬于比較高碼率的有損。
OPP
藍牙通信程序部分需采用用于設備之間傳輸數據對象OPP Profile: Object Push Profile由于OPP profile又細分為OPPC (client)端和OPPS(server)端profile,這兩個profile區別在于只有client端可以發起數據傳輸的過程,但是附件設備與手機通信的情景中,既有手機發起數據傳輸請求也有設備側發起傳輸請求的需要,所以要在設備中實現OPPC和OPPS兩個profile。
PBAP
電話號碼簿訪問協議(Phonebook Access Profile)
會議電視常用音頻協議有哪些

1、 ITU-T G.728
1992年ITU-T發布的電話聲音信號編碼方式推薦標準。采用LD-CELP編碼方式,采樣率為8KHz,以16kb/秒的速度傳送聲音信號,傳送延遲時間極短,僅有0.625 ms 的算法編碼延遲。
2、 ITU-T G.711
標準公布于1972年,其語音信號編碼是非均勻量化PCM。語音的采樣率為8KHz,每個樣值采用8bit量化,輸出的數據率為64kbps。這種窄帶編碼支持對300到 3,400赫茲的音頻進行壓縮。但雖然壓縮質量不錯,但是消耗的帶寬相對較大,主要用于數字PBX/ISDN上的數字式電話。
3、 ITU-T G.722
ITU-T G.722標準是第一個用于 16 KHZ 采樣率的標準化寬帶語音編碼算法,1984年被CCITT定義為標準,而且現今還在使用。.G.722 編解碼器在 16 kHz 頻率上接收 16 位數據(帶寬從 50 Hz 至 7 kHz),并將其壓縮為 64、56 與 48 Kbit/s,其總延遲約 3 ms,能夠提供更好的通話質量。
G.722的優點是延時和傳輸位誤差率非常低,且沒有任何的專利技術,費用低廉。因此G.722在無線通信系統,VoIP生產商,個人通信服務,視頻會議應用等廣泛應用。
4、 G.722.1
G.722.1基于 Polycom 的第三代 Siren 7 壓縮技術,1999年被ITU-T批準為G.722.1標準。G.722.1采用16 KHZ 采樣頻率,16 位數據量化,支持從 50 Hz 至 7 kHz頻率范圍的音頻采樣,并將其壓縮為 32 與 24 Kbit/s。它采用20 ms封幀,提供40ms的算法延遲。
G722.1可實現比 G.722 編解碼器更低的比特率以及更大的壓縮。目標是以大約一半的比特率實現與 G.722 大致相當的質量。這種編碼使用許可需要獲得Polycom公司的授權。
5、 G722.1 Annex C
G722.1 Annex C基于 Polycom 的Siren 14 壓縮技術, 采用32kHz采樣頻率,支持從 50 Hz 至 14 kHz頻率范圍的音頻采樣,并將其壓縮為 24、32或48 kbps。采用20ms封幀,提供40毫秒演算延遲。
2005年中,國際電信聯盟(ITU)批準Polycom Siren 14? 技術為14 kHz超寬帶音頻編碼新標準。同時進入作為ITU-T建議的G.722.1 Annex C。 G722.1 Annex C具有低運算能力,低帶寬的優點。適于處理語音、音樂與自然界聲音。
6、 AAC-LD
AAC(Advanced Audio Coding,高級音頻編碼)是由Fraunhofer研究院(MP3格式的創造者)、杜比(DOLBY)試驗室和AT&T(美國電話電報公司)共同研發出的一種音頻壓縮格式,是MPEG-2規范的一部分,并在1997年3月成為國際標準。隨著MPEG-4標準在2000年成型后,MPEG2 AAC也被作為核心編碼技術,并增加了一些新的編碼特性,又叫MPEG-4 AAC。
MPEG-4 AAC家族目前共有九種編碼規格,AAC-LD(Low Delay,低延遲規格)是用在低碼率下編碼。它支持8K~48K采樣率的,可以64Kbps的碼率輸出接近 CD 音質的音頻,并支持多聲音通道,AAC-LD 算法延遲僅為 20ms。
AAC因為其模塊化設計,功能更為強大。本身的框架結構能夠被不斷的新的東西填充,這就使得不同發展方面的內核相互融合,彼此吸收精華成為可能。
7、 各種音頻協議的主要參數對比:
采樣頻率 支持音頻帶寬 輸出碼率 最低算法延遲
G711 8KHz 300 Hz ~ 3,400 Hz 64 Kbps 《1ms
G722 16kHz 50 Hz ~ 7 kHz 64 Kbps 3ms
G722.1 16kHz 50 Hz ~7 kHz 24、32 Kbps 40ms
G722.1 C 32kHz 50 Hz~14 kHz 24、32、48Kbps 40ms
AAC-LD 48kHz 20 Hz-20kHz 48~64 Kbps 20ms
三、AAC_LD與G722. Annex C優缺點對比:
G722.1 C AAC_LD
采樣音頻頻率范圍支持50 Hz~14 kHz,接近CD音質,但丟失了高頻部分。
支持20 Hz-20kHz全頻段的采樣,音頻更加接近CD音質。
輸出碼率24、32、48Kbps,帶寬低于AAC-LD,但是以犧牲高頻為代價的。
48~64 Kbps,并支持大于64Kbps的輸出,為更好的音頻質量提供了可能。
算法復雜性算法復雜度低,CPU占用率略好于AAC-LD 模塊化設計,功能更為強大,有TI等專用芯片支持
最低延遲采用20ms封幀,40ms算法延遲 20ms算法延遲,好于G722.1 C
多聲道可以支持雙聲道 AAC支持多達48個音軌、15個低頻音軌
標準通用性G722.1-C 由Polycom制定開發,使用需要Polycom授權,目前只有Polycom和極少數會議電視廠商使用。 作為MPEG4核心標準,受到Apple、諾基亞、松下等支持,并被泰德等眾多會議電視廠商所采用,應用前景更廣闊。
在相同的采樣頻率下,AAC-LD可以提供比G722.1 C、MP3等更好的音質。AAC-LD實現了超寬頻音頻編碼中最短的延時,并保證接近CD的音質,達到音質、比特率和延時三者的最佳組合,是會議電視領域的最優選擇。
音頻格式有哪些

CD
CD格式的音質是比較高的音頻格式。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數播放軟件的“打開文件類型”中,都可以看到*.cda格式,這就是CD音軌了。標準CD格式也就是44.1K的采樣頻率,速率88K/秒,16位量化位數,因為CD音軌可以說是近似無損的,因此它的聲音基本上是忠于原聲的,因此如果你是一個音響發燒友的話,CD是你的首選。它會讓你感受到天籟之音。CD光盤可以在CD唱機中播放,也能用電腦里的各種播放軟件來重放。一個CD音頻文件是一個*.cda文件,這只是一個索引信息,并不是真正的包含聲音信息,所以不論CD音樂的長短,在電腦上看到的“*.cda文件”都是44字節長。注意:不能直接的復制CD格式的*.cda文件到硬盤上播放,需要使用像EAC這樣的抓音軌軟件把CD格式的文件轉換成WAV,這個轉換過程如果光盤驅動質量過關而且EAC的參數設置得當的話。可以說是基本上無損抓音頻。
WAVE
WAVE(*.WAV)是微軟公司開發的一種聲音文件格式,它符合PIFFResource Interchange File Format 文件規范,用于保存WINDOWS平臺的音頻信息資源,被WINDOWS平臺及其應用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數、采樣頻率和聲道,標準格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數,看到了吧,WAV格式的聲音文件質量和CD相差無幾,也是目前PC機上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認識”WAV格式。
AIFF
(Audio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。
AIFF是音頻交換文件格式的英文縮寫。是APPLE公司開發的一種音頻文件格式,被MACINTOSH平臺及其應用程序所支持,NETSCAPE瀏覽器中LIVEAUDIO也支持AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標準音頻格式,屬于QuickTime技術的一部分。這一格式的特點就是格式本身與數據的意義無關,因此受到了Microsoft的青睞,并據此搞出來WAV格式。AIFF雖然是一種很優秀的文件格式,但由于它是蘋果電腦上的格式,因此在PC平臺上并沒有得到很大的流行。不過由于Apple電腦多用于多媒體制作出版行業,因此幾乎所有的音頻編輯軟件和播放軟件都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還占有一席之地。由于AIFF的包容特性,所以它支持許多壓縮技術。
AU
AUDIO文件是SUN公司推出的一種數字音頻格式。AU文件原先是UNIX操作系統下的數字聲音文件。由于早期INTERNET上的WEB服務器主要是基于UNIX的,所以,AU格式的文件在如今的INTERNET中也是常用的聲音文件格式。
MPEG
MPEG是動態圖象專家組的英文縮寫。這個專家組始建于1988年,專門負責為CD建立視頻和音頻壓縮標準。MPEG音頻文件指的是MPEG標準中的聲音部分即MPEG音頻層。目前INTERNET上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優勢是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4
MP3
MP3格式誕生于八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應“*.mp1“/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,一般只有*.wav文件的1/10,因而音質要次于CD格式或WAV格式的聲音文件。由于其文件尺寸小,音質好;所以在它問世之初還沒有什么別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也一直找不到辦法解決,因為MP3沒有版權保護技術,說白了也就是誰都可以用。
MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術可以以固定的頻率采樣一首歌曲,而VBR(可變采樣頻率)則可以在音樂“忙”的時候加大采樣的頻率獲取更高的音質,不過產生的MP3文件可能在某些播放器上無法播放。把VBR的級別設定成為與前面的CBR文件的音質基本一樣,生成的VBR MP3文件為2.9MB。
MP3是到2008年止使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現時它的編碼技術并不完善,它更像一個編碼標準框架,留待人們去完善。早期的MP3編碼采用的的是固定編碼率的方式(CBR),看到的128Kbps,就是代表它是以128Kbps固定數據速率編碼——你可以提高這個編碼率,最高可以到320Kbps,音質會更好,自然,文件的體積會相應增大。
因為MP3的編碼方式是開放的,可以在這個標準框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由新公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing編碼器的VBR算法很差,音質與CBR(固定碼率)相去甚遠。但是,這種算法指明了一種方向,其他開發者紛紛推出自己的VBR算法,使得效果一直在改進。目前公認比較好的首推LAME,它完美地實現了VBR算法,而且它是是完全免費的軟件,并且由愛好者組成的開發團隊一直在不斷的發展完善。
而在VBR的基礎上,LAME更加發展出ABR算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
MP3問世不久,就憑這較高的壓縮比12:1和較好的音質創造了一個全新的音樂領域,然而MP3的開放性卻最終不可避免的導致了版權之爭,在這樣的背景之下,文件更小,音質更佳,同時還能有效保護版權的MP4就應運而生了。MP3和MP4之間其實并沒有必然的聯系,首先MP3是一種音頻壓縮的國際技術標準,而MP4卻是一個商標的名稱。
MPEG-4
MPEG-4標準是由國際運動圖像專家組于2000年10月公布的一種面向多媒體應用的視頻壓縮標準。它采用了基于對象的壓縮編碼技術,在編碼前首先對視頻序列進行分析,從原始圖像中分割出各個視頻對象,然后再分別對每個視頻對象的形狀信息、運動信息、紋理信息單獨編碼,并通過比MPEG-2更優的運動預測和運動補償來去除連續幀之間的時間冗余。其核心是基于內容的尺度可變性(Content-basedscalability),可以對圖像中各個對象分配優先級,對比較重要的對象用高的空間和時間分辨率表示,對不甚重要的對象(如監控系統的背景)以較低的分辨率表示,甚至不顯示。因此它具有自適應調配資源能力,可以實現高質量低速率的圖像通信和視頻傳輸。 MPEG-4以其高質量、低傳輸速率等優點已經被廣泛應用到網絡多媒體、視頻會議和多媒體監控等圖像傳輸系統中。中國內外大部分成熟的MPEG-4應用均為基于PC層面的客戶端和服務器模式,應用在嵌入式上的并不多,且多數嵌入式MPEG-4解碼系統大多使用商業的嵌入式操作系統,如WindowsCE、VxWorks等,成本高、靈活性差。如以嵌入式Linux作為操作系統不僅開發方便,且可以節約成本,并可以根據實際情況進行裁減,占用資源少、靈活性強,網絡性能好,適用范圍更廣。
MIDI
MIDI(Musical Instrument Digital Interface)格式被經常玩音樂的人使用,MIDI允許數字合成器和其他設備交換數據。MID文件格式由MIDI繼承而來。MID文件并不是一段錄制好的聲音,而是記錄聲音的信息,然后再告訴聲卡如何再現音樂的一組指令。這樣一個MIDI文件每存1分鐘的音樂只用大約5~10KB。MID文件主要用于原始樂器作品,流行歌曲的業余表演,游戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴聲卡的檔次。*.mid格式的最大用處是在電腦作曲領域。*.mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,制成*.mid文件。
WMA
WMA (Windows Media Audio) 格式是來自于微軟的重量級選手,后臺強硬,音質要強于MP3格式,更遠勝于RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了版權保護技術可以限制播放時間和播放次數甚至于播放的機器等等,這對被盜版攪得焦頭爛額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網絡上在線播放,作為微軟搶占網絡音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統和Windows Media Player的無縫捆綁讓你只要安裝了windows操作系統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉換為WMA聲音格式的功能,在新出品的操作系統Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄制時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用于網絡廣播。雖然現在網絡上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網絡音樂領域中直逼*.mp3,在網絡廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。
微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。應該說,WMA的推出,就是針對MP3沒有版權限制的缺點而來——普通用戶可能很歡迎這種格式,但作為版權擁有者的唱片公司來說,它們更喜歡難以復制拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求。
除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小(當然,只在MP3低于192KBPS碼率的情況下有效,實際上當采用LAME算法壓縮MP3格式時,高于192KBPS時普遍的反映是MP3的音質要好于WMA)。
RealAudio
RealAudio主要適用于在網絡上的在線音
樂欣賞,現在大多數的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音質。有的下載站點會提示你根據你的Modem速率選擇最佳的Real文件。real的的文件格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網絡帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質。
近來隨著網絡寬帶的普遍改善,Real公司正推出用于網絡廣播、達到CD音質的格式。如果你的軟件不能處理RealPlayer這種格式,它就會提醒你下載一個免費的升級包。許多音樂網站 提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer 9.0,第39期《電腦報》也對RealPlayer 9.0作了詳細的介紹,這里不再贅述。
VQF
雅馬哈公司另一種格式是*.vqf,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。也就是說把一首4分鐘的歌曲(WAV文件)壓成MP3,大約需要4MB左右的硬盤空間,而同一首歌曲,如果使用VQF音頻壓縮技術的話,那只需要2MB左右的硬盤空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對手。相同情況下壓縮后VQF的文件體積比MP3小30%~50%,更便利于網上傳播,同時音質極佳,接近CD音質(16位44.1kHz立體聲)。可以說技術上也是很先進的,但是由于宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav文件轉換到*.vqf文件的軟件。 此文件缺少特點外加缺乏宣傳。
當VQF以44KHz、80kbit/s的音頻采樣率壓縮音樂時,它的音質優于44KHz、128kbit/s的MP3,當VQF以44KHz、96kbit/s的頻率壓縮時,它的音質幾乎等于44KHz、256kbit/s的MP3。經SoundVQ壓縮后的音頻文件在進行回放效果試聽時,幾乎沒有人能聽出它與原音頻文件的差異。
播放VQF對計算機的配置要求僅為奔騰75或更高,當然如果您用奔騰100或以上的機器,VQF能夠運行得更加出色。實際上,播放VQF對CPU的要求僅比Mp3高5~10%左右。
VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的應用軟件都是免費的。只是NTT和YAMAHA并沒有公布VQF的源代碼。
OggVorbis
OggVorbis是一種新的音頻壓縮格式,類似于MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。Vorbis是這種音頻壓縮機制的名字,而Ogg則是一個計劃的名字,該計劃意圖設計一個完全開放性的多媒體系統。目前該計劃只實現了OggVorbis這一部分。
OggVorbis文件的擴展名是*.OGG。這種文件的設計格式是非常先進的。這種文件格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
VORBIS采用有損壓縮,但通過使用更加先進的聲學模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個原因,MP3格式是受專利保護的。如果你想使用MP3格式發布自己的作品,則需要付給Fraunhofer(發明MP3的公司)專利使用費。而VORBIS就完全沒有這個問題。
對于樂迷來說,使用OGG文件的顯著好處是可以用更小的文件獲得優越的聲音質量。而且,由于OGG是完全開放和免費的,制作OGG文件將不受任何專利限制,可望可以獲得大量的編碼器和播放器。這也是為何現在MP3編碼器如此少而且大多是商業軟件的原因,因為Fraunhofer要收取專利使用費。Vorbis使用了與MP3相比完全不同的數學原理,因此在壓縮音樂時受到的挑戰也不同。同樣位速率編碼的Vorbis和MP3文件具有同等的音樂質量。Vorbis具有一個設計良好、靈活的注釋,避免了象MP3文件的ID3標記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調節文件的位速率。Vorbis文件可以被分成小塊并以樣本粒度進行編輯;Vorbis支持多通道;Vorbis文件可以以邏輯方式相連接等。
AMR
AMR全稱Adaptive Multi-Rate,自適應多速率編碼,主要用于移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由于多用于人聲,通話,效果還是很不錯的。
分類
1. AMR: 又稱為AMR-NB,相對于下面的WB而言,語音寬帶范圍:300-3400Hz,8KHz抽樣
2. AMR-WB:AMR WideBand,
語音寬帶范圍: 50-7000Hz 16KHz抽樣
“AMR-WB”全稱為“Adaptive Multi-rate - Wideband”,即“自適應多速率寬帶編碼”,采樣頻率為16kHz,是一種同時被國際標準化組織ITU-T和3GPP采用的寬帶語音編碼標準,也稱為G722.2標準。AMR-WB提供語音帶寬范圍達到50~7000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易于分辨。
與之作比較,現在GSM用的EFR(Enhenced Full Rate,增強型全速率編碼)采樣頻率為8kHz,語音帶寬為200~3400Hz。
AMR-WB應用于窄帶GSM(全速信道16k,GMSK)的優勢在于其可采用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網絡繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種應用中,AMR-WB抗擾度優于AMR-NB。
AMR-WB應用于EDGE、3G可充分體現其優勢。足夠的傳輸寬帶保證AMR-WB可采用從 6.6kb/s到23.85kb/s共九種編碼,語音質量超越PSTN固定電話。
作為數字音樂文件格式的標準,WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或WMA格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG,JPEG就屬于混成壓縮,如果把壓縮的數據還原回去,數據其實是不一樣的。當然,人耳是無法分辨的。因此,如果把MP3,OGG格式從壓縮的狀態還原回去的話,就會產生損失。然而,APE格式即使還原,也能毫無損失地保留原有音質。所以,APE可以無損失高音質地壓縮和還原。在完全保持音質的前提下,APE的壓縮容量有了適當的減小。拿一個最為常見的38MBWAV文件為例,壓縮為APE格式后為25MB左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌曲已經算不上什么龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌曲,已經足夠了!
MP3支持格式有MP3和WMA。MP3由于是有損壓縮,因此講求采樣率,一般是44.1KHZ。另外,還有比特率,即數據流,一般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的一種音頻格式,相對來說要比MP3體積更小。
評論