123,123

你的位置：首頁 > 測試測量 > 正文

詳細(xì)解讀：MPEG音頻編解碼器

發(fā)布時(shí)間：2014-01-22 責(zé)任編輯：mikeliu

【導(dǎo)讀】相信大家都有使用過MP3播放器，那時(shí)候如果能有一個(gè)MP3隨身聽音樂那可真是爽呆了！不過，你們聽歌的時(shí)候一定不知道里面是怎么工作的吧？今天就給大家介紹一下里面的秘密。

音頻編解碼器是現(xiàn)代媒體系統(tǒng)的基礎(chǔ)核心之一。沒有音頻編解碼器，就不會有現(xiàn)在的數(shù)字廣播、流媒體服務(wù)及音樂發(fā)行。首個(gè)同時(shí)也仍是最主流的MPEG音頻編解碼器是于1998年面市的mp3。此后，F(xiàn)raunhofer IIS和其他ISO-MPEG成員參與者開發(fā)并制定了多個(gè)音頻編解碼器。每個(gè)MPEG音頻編解碼器已經(jīng)或?qū)淖兾覀兿M(fèi)媒體的方式。本文介紹了MPEG音頻編解碼器及其應(yīng)用，并展現(xiàn)現(xiàn)代音頻編碼方案最成功的創(chuàng)建者Fraunhofer IIS。

MPEG L3： mp3

mp3徹底改變了音樂產(chǎn)業(yè)，也改變了消費(fèi)者購買和享受音樂的方式。mp3目前仍然是音樂發(fā)行的主要格式，因?yàn)閙p3文件可以在任何設(shè)備上隨時(shí)隨地播放。mp3技術(shù)于上世紀(jì)80年代末開始開發(fā)，1995年，隨著以 “.mp3”為后綴的文件的誕生，該技術(shù)達(dá)到了頂峰。同年，F(xiàn)raunhofer IIS推出了第一個(gè)mp3播放器的硬件原型。該文件后綴mp3很快成為 “MPEG Layer 3”標(biāo)準(zhǔn)名稱的替稱，但是直到三年后，即1998年，第一款mp3播放器才投放市場。

mp3是一種感知型音頻編解碼器，這類編解碼器基于人類聽覺系統(tǒng)的感知模型。這些模型描述了人耳能夠感知以及無法感知的音頻信號元素，無論聽眾的耳朵是否經(jīng)受過訓(xùn)練。通過分析音頻信號，mp3和其他感知型音頻編解碼器確認(rèn)了以上事實(shí)，即音質(zhì)各指標(biāo)可按人耳的感知優(yōu)先排序，并在最終音頻文件中精細(xì)的表現(xiàn)出來。因此，如果比特率（即至少192 kbps）選擇得當(dāng)，聽眾則無法辨別mp3文件與源文件之間的差別。
不僅mp3基于感知模型，目前大部分的MPEG系列的音頻編解碼器也能夠明智的利用人類聽覺系統(tǒng)，來降低數(shù)據(jù)速率和文件大小。AAC系列的音頻編解碼器也不例外。

AAC系列

AAC-LC

在市場大規(guī)模采用mp3之前，MPEG就已開發(fā)另一款音頻編解碼器。目的是在顯著降低數(shù)據(jù)速率的同時(shí)實(shí)現(xiàn)與mp3同樣高品質(zhì)的音頻質(zhì)量。自此，開啟了研發(fā)序幕，從1994年的AAC ，至2012年的擴(kuò)展型HE-AAC。整個(gè)編解碼器系列序幕。

1994年，根據(jù)MPEG-2格式制定了首款新型AAC編解碼器，命名為高級音頻編碼（Advanced Audio Coding，AAC）。根據(jù)mp3和其他編解碼器專利的開發(fā)經(jīng)驗(yàn)，AT&T、Dolby、Fraunhofer IIS以及Sony等主要參與者從頭開始設(shè)計(jì)一款最先進(jìn)的新型音頻編解碼器。通過增加感知噪聲建模（Perceptual Noise Shaping，PNS）、頻帶復(fù)制（Spectral Band Replication，SBR），以及參數(shù)立體聲編碼（Parametric Stereo，PS）等工具，將MPEG-2 AAC編解碼器擴(kuò)展至MPEG-4標(biāo)準(zhǔn)。

基本的MPEG-4 AAC配置被稱為AAC-LC（低復(fù)雜性）的配置。它能提供“水晶般”的音頻質(zhì)量。在音頻編碼域中，“水晶般”音頻的編碼信號雖然在數(shù)學(xué)上與源文件有差異，但即便是擁有“金耳朵”的聽力專家也無法辨別其與源文件的區(qū)別。因此，AAC-LC可以滿足廣播公司最高的音頻質(zhì)量要求。立體聲AAC-LC比特率通常為128-192 kbps，5.1多聲道AAC-LC比特率為320 kbps，兩種AAC均以立聲道進(jìn)行編碼。AAC-LC是目前最靈活的音頻編解碼器之一，采樣率從8 kHz到192 kHz，每聲道的比特率高達(dá)256 kbps，并支持48聲道。該配置最著名的應(yīng)用就是Apple iTunes，并已用于日本ISDB數(shù)字電視標(biāo)準(zhǔn)。

圖1: MPEG AAC音頻編解碼器系列概覽

HE-AAC 和 HE-AACv2

[page]

MPEG-4“高效配置（High Efficiency Profile, HE-AAC）”結(jié)合了MPEG-4 AAC-LC和參量頻譜復(fù)制（Spectral Band Replication，SBR）工具，從而可以進(jìn)一步降低總比特率，同時(shí)保持出色的音頻質(zhì)量。當(dāng)立體聲信號的比特率低于128 kbps時(shí)，HE-AAC與同音頻質(zhì)量的AAC-LC相比，比特率降低了30%。對于HE-AAC，低音頻頻譜使用AAC-LC進(jìn)行編碼，高頻譜通過SBR工具編碼。頻譜復(fù)制是一種參數(shù)方法，可使用該頻譜的高低重新創(chuàng)建該信號的整個(gè)音頻頻譜。為了進(jìn)一步降低比特率，AAC-LC編碼使用總信號50%的采樣進(jìn)行低頻率編碼。HE-AAC立體聲所用的典型數(shù)據(jù)速率為48-64kbps，HE-AAC 5.1多聲道的典型數(shù)據(jù)速率為160 kbps。同AAC-LC一樣，HE-AAC支持8至 192kHz的采樣率、高達(dá)48個(gè)聲道以及音頻特定的元數(shù)據(jù)。

圖2: HE-AAC編碼器解碼器工作原理

“高效AAC v2配置（HE-AACv2）”在HE-AAC基礎(chǔ)上添加了參數(shù)聲音（Parametric Sound，PS）工具。HE-AACv2 應(yīng)用參數(shù)進(jìn)行立體聲信號編碼，并進(jìn)一步降低了比特率。參數(shù)聲音編碼器不是發(fā)送兩個(gè)聲道，而是從立體聲信號中提取參數(shù)，在解碼器側(cè)重建立體聲信號，然后生成一個(gè)HE-AAC編碼的單聲道混音。參數(shù)數(shù)據(jù)與頻譜數(shù)據(jù)在AAC比特流的輔助數(shù)據(jù)字段中傳輸。解碼器解碼單聲道信號，參數(shù)解碼器重建立體聲。對于立體聲來說，采用參數(shù)數(shù)據(jù)傳輸HE-AAC編碼的單聲道信號比傳輸雙聲道、HE-AAC編碼信號的效率更高。對于立體聲信號來說，HE-AACv2典型比特率為24至32 kbps。

圖3: HE-AAC v2編碼器解碼器工作原理

目前，AAC和HE-AAC得到廣泛應(yīng)用。尤其是在互聯(lián)網(wǎng)應(yīng)用中， AAC和HE-AAC是mp3之外主要的音頻編解碼器。

HE-AACv2廣泛地應(yīng)用于最先進(jìn)的電視廣播系統(tǒng)。它是DVB工具箱的組成部分，還是最近推出了第二代地面電視指定的編解碼器，應(yīng)用在西班牙、英國、法國、愛爾蘭、瑞典、奧地利、意大利、丹麥、芬蘭和挪威等國家。在巴西和南美洲的大多數(shù)國家，HE-AAC是地面電視廣播的唯一指定音頻編解碼器。此外，HE-AAC也是智能電視中的一個(gè)指定部件。例如，它是歐洲混合廣播寬帶電視（Hybrid Broadcast Broadband TV，HbbTV）數(shù)據(jù)服務(wù)的指定編解碼器。因此，所有高清電視接收器設(shè)備，如目前歐洲和南美洲銷售的電視機(jī)和機(jī)頂盒，都支持HE-AAC。所有主要廣播編碼器廠商很早之前便將HE-AAC部署到他們的設(shè)備中。當(dāng)然，HE-AACv2支持所有相關(guān)的廣播元數(shù)據(jù)。

HE-AAC是主流音頻流媒體編解碼器。所有主要的流媒體平臺都支持HE-AAC，包括Flash、Silverlight、Windows Media Player、Winamp以及iTunes。Mac OS X和Windows等操作系統(tǒng)中都有HE-AAC， iOS、Android、Windows Phone、Symbian及BlackBerry等手機(jī)系統(tǒng)也是如此。
目前，蘋果HLS、微軟Smooth Streaming及Adobe Dynamic Streaming等成熟的http適配流媒體系統(tǒng)也基于AAC系列編解碼器。

HE-AACv2還是消費(fèi)電子領(lǐng)域內(nèi)流媒體標(biāo)準(zhǔn)的一個(gè)重要部分，在Open IPTV Forum、ATIS、HbbTV和DLNA等電子領(lǐng)域發(fā)揮著不可或缺的作用。因此，幾乎所有的數(shù)字電視、藍(lán)光播放器、機(jī)頂盒和游戲機(jī)都支持該編解碼器。HE-AACv2的廣泛支持使它成為內(nèi)容提供商選擇的最佳編解碼器。因此，Pandora、Aupeo、Hulu以及BBC iPlayer等大多數(shù)網(wǎng)絡(luò)廣播都基于HE-AACv2。
[page]

MPEG Surround

MPEG Surround技術(shù)可以看作是參數(shù)立體聲原理從立體聲到多聲道的擴(kuò)展。不同于參數(shù)立體聲工具，MPEG Surround在比特率和質(zhì)量方面更具擴(kuò)展性。MPEG Surround可與AAC系列編解碼器相結(jié)合，提供更高的編碼效率。MPEG Surround的另一個(gè)優(yōu)勢是它能夠反向兼容立體聲信號。比特流始終包含AAC編碼核心立體聲信號和MPEG Surround這兩個(gè)元素。立體聲解碼器可以提取核心立體聲信號，并對其進(jìn)行解碼，而支持MPEG Surround的解碼器可重建整個(gè)多聲道音頻信號。這樣，就可以通過平價(jià)或傳統(tǒng)的立體聲接收器或多聲道接收器在混合信號接收器中使用MPEG Surround，而無需同時(shí)播放立體聲和多聲道信號。

圖4: MPEG Surround編解碼組合

低延遲音頻編解碼器： AAC-LD、AAC-ELD和AAC-ELDv2

MPEG編解碼器不僅廣泛應(yīng)用于廣播、流媒體和音樂發(fā)行中，還用于通信應(yīng)用。AAC系列通信編解碼器在高品質(zhì)會議和視頻電話系統(tǒng)中尤其受歡迎，因?yàn)樗鼈儙椭?wù)提供商和運(yùn)營商提供全高清的語音服務(wù)。全高清語音是通信系統(tǒng)能夠?qū)崿F(xiàn)的最高音頻質(zhì)量。傳統(tǒng)的窄帶電話僅能傳輸最高 3.5 kHz的音頻帶寬，而全高清語音系統(tǒng)則能傳輸從14 kHz到人耳能聽到的全部音頻頻譜。通過這種方法，全高清語音通話聽起來像與同一房間的人交談那樣清晰。AAC系列的全高清語音編解碼器包括低延遲 AAC (Low Delay AAC，AAC-LD)、增強(qiáng)型低延遲 AAC (Enhanced Low Delay AAC，AAC-ELD)以及增強(qiáng)型低延遲AACv2 (AAC-ELDv2)。

AAC-LD是高品質(zhì)視頻會議的行業(yè)標(biāo)準(zhǔn)，可提供全帶寬、低延遲的音頻編碼。它具有僅20毫秒的算法延遲，同時(shí)為所有類型的音頻信號提供良好的壓縮率和高聲質(zhì)。

AAC-ELD是AAC-LD的增強(qiáng)型版本，結(jié)合了MPEG-4 AAC-LD和頻譜復(fù)制。 AAC-ELD也是所有要求在24 kbps低數(shù)據(jù)速率下?lián)碛腥纛l帶寬的延遲敏感型應(yīng)用的最佳選擇。

AAC-LD和AAC-ELD目前已經(jīng)用于專業(yè)及消費(fèi)級視頻會議應(yīng)用，例如，蘋果的FaceTime應(yīng)用就是基于AAC-ELD。

AAC-ELDv2是卓越的AAC-ELD音頻編解碼器的最新擴(kuò)展。AAC-ELDv2結(jié)合了AAC-ELD優(yōu)化延遲參數(shù)多聲道編碼的優(yōu)勢這種方法只允許傳輸一個(gè)單聲道及其他信息，而不是兩個(gè)獨(dú)立的聲道。

擴(kuò)展型HE-AAC

AAC系列的最新成員是擴(kuò)展型HE-AAC。2012 年年初，MPEG標(biāo)準(zhǔn)化剛剛完成。擴(kuò)展型HE-AAC顯著提高了音樂和語音的音頻質(zhì)量，尤其是在8 kbps等極低的比特率下，并與HE-AAC流兼容。新的編解碼器將兩個(gè)先前分離的通用音頻編碼和語音編碼結(jié)合在一起，具備了現(xiàn)有的語音和音樂編解碼器的優(yōu)勢。HE-AACv2音頻編解碼器添加了一套新的編碼工具后，擴(kuò)展型HE-AAC的性能大大超過了專用語音和通用音頻編碼方案，彌補(bǔ)了二者的不足，為所有信號類型提供一致的高品質(zhì)音頻。

結(jié)語

無論是娛樂還是通信應(yīng)用，MPEG音頻編解碼器用于所有最先進(jìn)的消費(fèi)電子、IT和通信設(shè)備中。從上世紀(jì)90年代末開始出現(xiàn)的mp3起，MPEG音頻編解碼器的發(fā)展從未間斷過。mp3及其后續(xù)產(chǎn)品AAC在消費(fèi)領(lǐng)域廣為人知，對于HE-AAC或AAC-ELD等在后臺運(yùn)行的其他MPEG編解碼器，只有專業(yè)人士才有所了解，但大部分人在日常生活中都在使用這些編解碼器，例如，觀看互聯(lián)網(wǎng)視頻或使用Apple FaceTime打電話。Fraunhofer IIS在每個(gè)音頻編解碼器的開發(fā)和市場推廣方面都起到了重要作用。

相關(guān)閱讀：

AZBOX高清接收機(jī)
Sentry：泰克推出數(shù)字內(nèi)容監(jiān)視器用于確保自適應(yīng)流媒體服務(wù)質(zhì)量
深入探討視頻系統(tǒng)設(shè)計(jì)中的HD技術(shù)

要采購工具么，點(diǎn)這里了解一下價(jià)格!

上一篇：拆聯(lián)通版小米3，驗(yàn)內(nèi)部真相如何？

下一篇：大師推薦：超實(shí)用的電路板設(shè)計(jì)技巧

特別推薦

噪聲中提取真值！瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
10MHz高頻運(yùn)行！氮矽科技發(fā)布集成驅(qū)動GaN芯片，助力電源能效再攀新高
失真度僅0.002%！力芯微推出超低內(nèi)阻、超低失真4PST模擬開關(guān)
一“芯”雙電！圣邦微電子發(fā)布雙輸出電源芯片，簡化AFE與音頻設(shè)計(jì)
一機(jī)適配萬端：金升陽推出1200W可編程電源，賦能高端裝備制造

技術(shù)文章更多>>

技術(shù)白皮書下載更多>>

熱門搜索

詳細(xì)解讀：MPEG音頻編解碼器

友情鏈接(QQ：317243736)