【導讀】聲音是人與人交戶的重要手段,在AI興起的現(xiàn)今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現(xiàn)在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。
著名作家海倫·凱勒曾說過這樣一句話,“盲隔絕了人與物,聾隔絕了人與人?!笨梢娐犃Φ闹匾裕纱丝梢钥闯?,人的一生耳朵是最忙的感知系統(tǒng)之一。
聲音是人與人交戶的重要手段,在AI興起的現(xiàn)今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現(xiàn)在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。
據(jù)SIG預測,到2027年藍牙音頻傳輸設備年出貨量將達18.4億臺,2023年~2027年的年復合增長率為6%,藍牙數(shù)據(jù)傳輸設備年度出貨量將達到18.7億臺,2023年~2027年的復合年增長率為11%。
ICCAD 2023上,炬芯科技股份有限公司董事長兼CEO周正宇博士博士分享了炬芯在AI大背景下,如何為音頻芯片提供更多創(chuàng)新。
20多年專注音頻領域
“炬芯的前身就是原來的炬力集成,我們在行業(yè)中做了20多年音頻,2005年炬力集成基于便攜式音頻在美國上市,2021年炬芯基于藍牙音頻在科創(chuàng)板上市。”周正宇博士這樣介紹道。
炬芯2023年半年報和官網(wǎng)顯示,其核心產(chǎn)品包括藍牙音頻SoC芯片、端側AI處理器芯片、便攜式音視頻SoC芯片三類。
藍牙音頻 SoC 芯片系列主要應用于藍牙音箱(含TWS音箱、智能藍牙音箱)、Soundbar、智能手表、藍牙耳機(含TWS耳機、開放式OWS耳機)、無線電競耳機等。
端側AI處理器芯片系列是基于端側的帶有人工智能加速器的 系統(tǒng)級音頻處理器,致力于提供智能物聯(lián)網(wǎng)AIoT端側低功耗算力的芯片平臺,也是炬芯主營的音頻產(chǎn)品和人工智能技術的重要結合點,可滿足市場未來日新月異的低功耗端側設備的人工智能應用需求。
便攜式音視頻SoC芯片系列是炬芯最早耕耘的、最成熟的產(chǎn)品線,全球市場占有率長期較高,搭載了公司長期積累的、較先進的低功耗音視頻處理技術。該系列芯片主要針對便攜式高品質(zhì)音視頻編解碼類產(chǎn)品的應用。
具體從市場來看,炬芯在中高端品牌藍牙音箱市場份額明顯增長,下一步會通過產(chǎn)品持續(xù)迭代升級和優(yōu)化產(chǎn)品組合繼續(xù)提升在中高端品牌的滲透率;低延遲高音質(zhì)市場從有線連接向無線連接轉換的趨勢,帶來了存量市場轉化和新增需求兩個機會,炬芯正在持續(xù)加大研發(fā)投入保持技術領先優(yōu)勢并與各大品牌廠商繼續(xù)保持緊密合作以把握這一波市場轉型機會;此外,在智能手表市場,炬芯對中國、歐美和印度市場做了均衡的布局和節(jié)奏把握,智能手表作為貼合人體重要的健康數(shù)據(jù)監(jiān)測產(chǎn)品,將持續(xù)深耕。
用存內(nèi)計算創(chuàng)造更大算力和更低功耗
周正宇博士表示,過去以來,炬芯的芯片架構一般都是“CPU+DSP”的雙核架構,未來,AI時代,炬芯會在CPU和DSP的基礎上,從高端音頻芯片入手,整合低功耗 AI 加速引擎,逐步全面升級為 CPU+DSP+NPU(based MMSCIM)三核異構的AI SoC架構,為便攜式產(chǎn)品提供更大的算力。,最新一代基于MMSCIM的高端AI音頻芯片ATS286X,將會在明年將會Sample。
“算力和功耗是一對矛盾統(tǒng)一體。”周正宇博士認為,如何在同樣的制程、同樣的架構、同樣的設計下,創(chuàng)造更大算力和更低功耗是AI時代的關鍵。
比如說,TWS耳機電池容量通常在35m~40mAh,典型平均工作電流約在5mA左右,也就是說,留給芯片的功耗預算只有20mA左右。再比如,智能手表典型電池容量在280~300mAh,典型工作電流在3mA上下,也就是說在4.3V鋰電池中,只有15mA左右的功耗,還包括ADC、DAC等器件,也就是說留給藍牙音頻芯片功耗只有10mW。
與之相悖的是,AI驅(qū)動下,未來算力需求越來越大,也就是說,對藍牙音頻芯片商來說,要在10mW的功耗預算下,打造200~500GOPS算力是很大難題。
AI主要以復雜矩陣運算來形成,而復雜的矩陣運算最主要的算力功耗都來自于乘累加運算,過去芯片普遍采用DSP處理音頻,突破的關鍵就在于突破馮諾范式的存儲墻和功耗墻,即存內(nèi)計算,通俗解釋就是把計算和存儲放在一個房間里去,讓它們零距離溝通。
存內(nèi)計算擁有許多不同介質(zhì),到底哪一種介質(zhì)適合做存內(nèi)計算?周正宇博士認為各個介質(zhì)均有其特點,不論哪種路徑,最主要的問題就是寫入次數(shù),假若AI需要做自適應或模型不斷更新,那么它在寫入多次之后就會報廢,所以這種介質(zhì)不適合做自適應應用,類似于Transformer這一類擁有自學能力的模型。
對比來看,SRAM讀寫速度快,擁有無限次讀寫能力,不僅采用標準工藝制造,還可以集成在SoC內(nèi),但它的弱點是存儲密度低。不過,雖然如此,SRAM依舊是低功耗AI算力的首選。一方面,音頻只需要200~500GOPS的算力,而非幾十TOPS,密度低的缺陷因此而被規(guī)避,另一方面,標準的CMOS工藝不僅可以現(xiàn)在就能大規(guī)模量產(chǎn),還可以集成在單芯片上跟隨制程工藝演進到2nm。加之無限次寫入,可以支持自適應計算,長遠來看,RL(強化學習)和ML(機器學習)可能也會為它帶來更多驚喜。
存內(nèi)計算也擁有模擬和數(shù)?;旌蟽蓚€技術路徑,它們最大的差異主要在于運算用ADC+模擬電路實現(xiàn)的,還是基于數(shù)字電路實現(xiàn)。
炬芯科技選擇的是模數(shù)混合的存內(nèi)計算,暫時命名為“Mixed-Mode SRAM based CIM”,簡稱MMSCIM,其優(yōu)勢是精度無限,可靠性和量產(chǎn)的一致性非常高,容易在制程上升級,容易提升速度或PPA。
目前,該芯片雖然還沒有進入量產(chǎn)階段,但進展非???。它在全矩陣運算情況下,未來22nm就有望達到每瓦7.8TOPS的能效比。值得一提的是,在12nm情況下,它就已經(jīng)接近50TOPS,足以挑戰(zhàn)在10mW范圍內(nèi)釋放200~500GOPS算力。
邊緣與AI融合,挑戰(zhàn)與機遇并存
在周正宇博士看來,未來端側也會實現(xiàn)像ChatGPT、Tranformoer或類似的功能,或許是手機,或者是手表,未來這些能力都能被人所觸及。就比如說,早年軟盤只有1.44MB的存儲空間,而現(xiàn)在TWS耳機中的存儲空間都超過了幾十兆。
端側是AI非常好的載體,以手表為例,它是唯一一個長時間佩戴且緊貼皮膚的裝置,因此,非常方便成為健康監(jiān)測裝置,隨著傳感器發(fā)展,心率、血壓信息都成為了可測量的數(shù)據(jù)。而最終,它會成為一個能夠隨時監(jiān)測健康狀態(tài)的能手。
把幾億人的信息全部送到云端處理顯然不現(xiàn)實,而當邊緣端擁有AI,把專業(yè)的醫(yī)學知識灌注給它,它就會像一個移動醫(yī)生一樣,隨時判斷心率、血氧變化是否健康。這就是邊緣AI的重要意義,這樣的例子在邊緣AI中不勝枚舉。
當然,挑戰(zhàn)與機遇并存。對國產(chǎn)來說,在端側做AI挑戰(zhàn)有兩方面,一方面如何以更好的能效比、PPA來實現(xiàn)人工智能,另一方面則是在于芯片制造,如何利用主流制程做到先進制程的產(chǎn)品性能,這是國產(chǎn)芯片設計公司必須面對的挑戰(zhàn)。
自從ChatGPT問世,最大的變化是自學習和自適應,而在其中隱私是很大問題,未來端側也必然也要面對這樣的挑戰(zhàn)。
”我認為現(xiàn)在AI最缺乏的是生態(tài)?!笔聦嵣希酒袠I(yè)大多情況都會把重點放在硬件設計,但實際上,一個行業(yè)必須擁有自己的生態(tài),國內(nèi)更需要自己的生態(tài)。就比如說,TensorFlow與算力之前其實中間還間隔了很多層,或者說工具,如果能做好這一層,就能建設好更好的國產(chǎn)生態(tài)。炬芯也會持續(xù)深耕,為國產(chǎn)芯片與生態(tài)建設添磚加瓦。
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。
推薦閱讀:
以工藝窗口建模探索路徑:使用虛擬制造評估先進DRAM電容器圖形化的工藝窗口
如何為ADAS 域控制器構建多攝像頭視覺感知系統(tǒng)?