【導讀】清晨6:30,智能手機的鬧鐘準時響起,提醒您該起床了。在開始工作前,只需發(fā)出語音命令,手機即會為您讀出全天的會議和預約安排,同時啟動咖啡機,為您準備香氣四溢的咖啡。收到生日提醒后,您說“打電話給媽媽”,電話就會自動撥出,祝媽媽生日快樂。一切就是這么簡單,一早的例行公事完成得井然有序,而這個過程中,您完全無需觸碰手機!手機隨時隨地都在獲取您的語音命令,處理信息。
無論是每天早晨的例行公事,還是其他點點滴滴,永遠在線(Always-On)蘊含的無限潛力都能助您一臂之力,讓生活更加簡單便利。移動系統(tǒng)、可穿戴設備和許多其他物聯(lián)網(wǎng)(IoT)應用都需要這項技術(shù)——系統(tǒng)中的一些計算資源永遠在線,隨時處理音頻、視頻或其他傳感器數(shù)據(jù)。為了進一步增強電池供電設備的可用性,專門用于Always-On任務的計算資源應經(jīng)過專門優(yōu)化;而系統(tǒng)中的其他資源則可保持休眠,直到真正需要時再被喚醒。
毋庸置疑,新一代產(chǎn)品正在重新詮釋我們對人機界面的理解,對比短短5年前,現(xiàn)在的用戶體驗已經(jīng)變得更加豐富多彩,引人入勝。但這也給設計師帶來了全新的挑戰(zhàn):如何在繼續(xù)為客戶營造愉悅體驗的前提下,實現(xiàn)響應速度、成本和功耗之間的平衡?本文中,我們將就此問題進行探討,并介紹如何采用“認知分層”的方法搭建Always-On架構(gòu),幫助設計師實現(xiàn)產(chǎn)品設計的最佳平衡。
設計高效節(jié)能的Always-On架構(gòu)
針對特定的IoT應用,片上系統(tǒng)(SoC)由多種模擬器件(例如無線電、低噪聲放大器(RX)、電源管理單元和集成功率放大器)及數(shù)字器件(例如處理器、數(shù)字信號處理器、片上存儲器、數(shù)字基帶硬件組塊和豐富的傳感器I/O)構(gòu)成。
包括麥克風、攝像頭、加速計、陀螺儀、溫度計和壓力計等在內(nèi)的傳感器是智能、互聯(lián),Always-On設備的核心。傳感器對收集到的數(shù)據(jù)進行數(shù)字化處理,并將數(shù)字化信息發(fā)送到SoC進行分析和解讀。
Always-On架構(gòu)的開發(fā)可同時采用多項技術(shù),降低IoT應用的功耗:
●功耗、時鐘和數(shù)據(jù)門控
●傳感器融合算法,用于確定設備上下文,并以此為基礎(chǔ)實現(xiàn)系統(tǒng)功耗的智能管理
●針對開銷巨大的函數(shù)進行優(yōu)化,例如:
●從指令集層面減少時鐘周期開銷數(shù)(cycle)從而降低對頻率的需求(MHz)
●在互聯(lián)級架設通用片上總線旁路
●通過存儲分區(qū)使流量局部化
●針對語音算法、加密等同類應用,加快通信標準和性能
除上述技術(shù)外,認知分層尤其是實現(xiàn)最佳功耗/性能平衡的理想方案。下面,我們將進行更詳細的論述。
認知分層:主處理器任務負載卸載
認知分層將任務劃分成若干層或狀態(tài),分別使用經(jīng)過專門優(yōu)化的引擎處理。通過將一些任務轉(zhuǎn)移到經(jīng)過專門優(yōu)化的低功耗Always-On處理器,認知分層即可實現(xiàn)主處理器任務分流。圖1描述了語音觸發(fā)應用,每層的處理能力恰好足夠支持系統(tǒng)此刻所需的響應速度,且不會浪費資源。采用此方法,延遲、功耗和吞吐量性能都會得到提升。
圖1:認知分層可以最大限度地降低功耗
圖1中最靠下的環(huán)節(jié)是低功耗噪聲檢測,耗能僅為毫微瓦級。從檢測觸發(fā)命令到識別短語,以及當前應用上下文環(huán)境下的解讀,噪聲檢測會沿處理鏈向上觸發(fā)一系列系統(tǒng)動作。這一系列動作中,后一個動作的功耗總是略高于前一個動作。使用云服務處理完整對話需要訪問遠程服務器及數(shù)據(jù)庫,并進行交互,因此能耗最高,可以達到數(shù)瓦。
在較低層,根據(jù)特定的計算和接口要求專門設計并優(yōu)化過的處理引擎,將取代低效率的通用處理器。相比通用處理器,經(jīng)過專門優(yōu)化的處理器在Always-On系統(tǒng)中的性能更高,響應延遲更短,功耗更低。
通過盡可能關(guān)閉不必要的系統(tǒng),認知分層使計算層與數(shù)據(jù)來源更加接近,系統(tǒng)可以調(diào)用最少的活動資源完成當前任務。認知分層可以優(yōu)化性能和功耗,適用于從慣性導航到計算機視覺,再到本地無線通信等多種IoT應用領(lǐng)域。
優(yōu)秀Always-On處理器的要素
IoT應用豐富多彩,對處理能力的要求也因應用而異,“一刀切”的作法對Always-On處理器并不適用?;谏鲜鰧φJ知分層的闡釋,小型、低功耗、高度專業(yè)化的處理器可以承擔對認知功能要求較低的工作,減少占用主處理器資源,降低功耗。
例如,經(jīng)過低功耗語音觸發(fā)優(yōu)化的數(shù)字信號處理器(DSP)不會處理高耗能的音頻編解碼工作,而是將之移交專為該用途設計的DSP;與之類似,經(jīng)過音頻編解碼優(yōu)化的DSP,也會將用戶和網(wǎng)絡交互的任務移交給其他為該用途設計的應用處理器。
圖2:低功耗處理器為日趨復雜的信號處理保駕護航
盡管主應用處理器“可以”運行所有算法,但使用經(jīng)過專門優(yōu)化的處理器能讓設計更加節(jié)能。在上述的語音觸發(fā)示例中,指定使用低功耗Always-On DSP運行語音觸發(fā)器當然也可以將之用于執(zhí)行其他低功耗要求的任務,例如傳感器數(shù)據(jù)處理和低分辨率圖像處理。如圖2所示,可穿戴設備等IoT應用需要具備超低功耗下處理復雜信號的能力。
支持Always-On應用的處理器需要具備以下要素:
●針對關(guān)鍵算法的低指令執(zhí)行周期,高效的指令集
●執(zhí)行DSP處理和控制任務的能力
●低功耗設計
●尺寸小,理想情況下可以按需配置,并可以去除冗余的邏輯設計
●按所需的功能范圍擴展性能
●用于傳感器數(shù)據(jù)處理的高效浮點運算
面向IoT、可穿戴設備和無線應用的靈活DSP
Cadence公司的Tensilica Fusion DSP就屬于單一可擴展DSP,可以滿足低功耗及Always-On功能的各項需求。Cadence Tensilica Fusion DSP使用可選擇的指令集架構(gòu)(ISA)擴展,加快多種無線協(xié)議和浮點運算的速度;并將增強型32位Xtensa控制處理器與DSP功能及靈活的特定算法加速相結(jié)合。作為IoT設備設計師,您可以按需選擇個性化的配置,對比配置單一的“一刀切”處理器,Tensilica Fusion DSP的尺寸更小,性能更高,功耗也更低。
圖3:Cadence Tensilica Fusion DSP基于Xtensa處理器,由多項可配置元件構(gòu)成,適用于低功耗Always-On系統(tǒng)。
Tensilica Fusion DSP(圖3)的可配置元件包括:
●單精度浮點單元——浮點指令與64位數(shù)據(jù)讀取/寫回同時發(fā)射。這對使用MATLAB或標準C代碼創(chuàng)建算法的軟件來說,開發(fā)速度可以得到加快。
●音頻/語音(AVS)——與TensilicaHiFi DSP共享軟件兼容性,由140余個HiFi音頻/語音軟件包構(gòu)成的生態(tài)系統(tǒng)為其提供支持。
●16位Quad MAC——進一步加速低功耗藍牙及Wi-Fi等通信標準,同時配有語音編解碼器/識別算法。
●為低功耗藍牙和Wi-Fi AES-128無線操作實現(xiàn)的加密提速
●先進的位處理——加快基帶MAC和PHY的設計實現(xiàn)
●適用于高速緩存和/或不同容量的本地內(nèi)存的、靈活的內(nèi)存架構(gòu)
總結(jié)
Always-On技術(shù)在生活中的運用越來越廣泛。設計出成功的Always-On產(chǎn)品充滿挑戰(zhàn),特別是如何找到響應速度、成本和功耗的平衡點。
采用認知分層,同時使用可配置的低功耗Always-On DSP,能助您找到這一平衡點。通過將Always-On功能分配給低功耗處理器,系統(tǒng)的主處理器則可以將資源用于處理更復雜的任務,從而優(yōu)化設計,在不犧牲性能及功能性的前提下,消耗最小的能源執(zhí)行任務處理。
免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。
推薦閱讀: