你的位置:首頁(yè) > 互連技術(shù) > 正文

邊緣AI開發(fā),如何駛上快車道?

發(fā)布時(shí)間:2023-06-25 來(lái)源:Mouser 責(zé)任編輯:wenwei

【導(dǎo)讀】在云計(jì)算之后,邊緣計(jì)算將成為未來(lái)十年物聯(lián)網(wǎng)市場(chǎng)新的增長(zhǎng)點(diǎn),這已經(jīng)是不爭(zhēng)的事實(shí)。據(jù)市場(chǎng)研究機(jī)構(gòu)Gartner預(yù)測(cè),到2025年將有75%的數(shù)據(jù)產(chǎn)生于網(wǎng)絡(luò)邊緣,也就是說(shuō)整個(gè)智能世界的計(jì)算資源分布重心正在移向“邊緣”。


不同于傳統(tǒng)云計(jì)算架構(gòu)中將所有計(jì)算資源都集中在云端的做法,邊緣計(jì)算將更多的計(jì)算任務(wù)放到網(wǎng)絡(luò)邊緣端完成,這樣的計(jì)算架構(gòu)在減少延遲、避免大量數(shù)據(jù)傳輸對(duì)帶寬的占用、保護(hù)本地敏感數(shù)據(jù)安全等方面有獨(dú)特的優(yōu)勢(shì)。


特別是隨著人工智能(AI)應(yīng)用的普及,“在云端訓(xùn)練,在邊緣端推理”的模式已被普遍認(rèn)同。通過(guò)在邊緣設(shè)備中部署經(jīng)過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)模型,讓邊緣設(shè)備能夠快速、高效地完成AI推理工作,可以促使越來(lái)越多的AI應(yīng)用加速落地。


國(guó)際電信咨詢公司STL Partners預(yù)測(cè),邊緣計(jì)算的潛在市場(chǎng)將從2020年的90億美元快速攀升至2030年的4,450億美元,復(fù)合年增長(zhǎng)率高達(dá)48%!而如此蓬勃發(fā)展的市場(chǎng),也給置身其中的玩家提出了更高的要求——想要跟上市場(chǎng)發(fā)展的速度,就需要你的邊緣AI開發(fā)也能夠駛?cè)肟燔嚨馈?/p>


邊緣AI催生自適應(yīng)計(jì)算


應(yīng)用開發(fā)想要“上高速”,一個(gè)先決條件就是要選一臺(tái)跑得快的好“車”——針對(duì)邊緣AI開發(fā)來(lái)講,就是要挑選一個(gè)可以任性“加速”的開發(fā)平臺(tái)。


一個(gè)AI推理應(yīng)用,既需要對(duì)AI處理部分進(jìn)行加速,也需要滿足非AI的預(yù)處理和后處理等環(huán)節(jié)的功能要求,也就是說(shuō)要對(duì)整體的應(yīng)用流程進(jìn)行優(yōu)化。


針對(duì)這樣的開發(fā)需求,使用單一架構(gòu)的通用CPU,雖然靈活可擴(kuò)展,可以支持不同應(yīng)用的要求,但對(duì)于整體應(yīng)用流程加速顯然會(huì)捉襟見肘,力不從心。而如果為AI應(yīng)用開發(fā)專門的ASIC或ASSP,雖然可以提供高度優(yōu)化的應(yīng)用實(shí)現(xiàn)方案以及高確定性與低時(shí)延,但又會(huì)面臨著開發(fā)周期長(zhǎng)、研發(fā)成本高的困擾。與此同時(shí),采用固定專用芯片架構(gòu)還面臨著一個(gè)更嚴(yán)峻的挑戰(zhàn),那就是AI模型的技術(shù)迭代速度遠(yuǎn)遠(yuǎn)快于芯片開發(fā)的周期,這就會(huì)導(dǎo)致芯片好不容易開發(fā)出來(lái)就已經(jīng)落伍了,成為無(wú)可挽回的沉沒(méi)成本。


29.jpg

圖1:AI推理應(yīng)用需要全流程的整體應(yīng)用加速

(圖源:AMD)


面對(duì)多樣化的邊緣應(yīng)用、快速迭代的AI技術(shù),既然通用的CPU和專用的芯片都無(wú)法滿足要求,就需要一種新的開發(fā)平臺(tái)來(lái)補(bǔ)位——這就是基于可編程邏輯的自適應(yīng)計(jì)算平臺(tái)。


所謂自適應(yīng)計(jì)算平臺(tái),就是在不同規(guī)模的FPGA結(jié)構(gòu)上集成一個(gè)或多個(gè)嵌入式CPU 子系統(tǒng)、IO及其他外設(shè)模塊的異構(gòu)計(jì)算平臺(tái)。這種平臺(tái)也被稱為自適應(yīng)SoC或FPGA SoC,它既有嵌入式CPU子系統(tǒng)所具備的靈活性,又可通過(guò)硬件編程提供所需的數(shù)據(jù)處理加速性能,因此開發(fā)者能夠?qū)⒄_的任務(wù)分配給正確的計(jì)算引擎,最終既能夠?yàn)锳I推理進(jìn)行加速,又可以滿足非AI部分的計(jì)算要求,進(jìn)而為各類特定應(yīng)用提供理想的解決方案。而且,即使工作負(fù)載或標(biāo)準(zhǔn)發(fā)生演進(jìn)和變化,自適應(yīng)SoC仍能根據(jù)需要快速配置、靈活適應(yīng)。


正是因?yàn)樽赃m應(yīng)SoC兼具性能和靈活性的優(yōu)勢(shì),近年來(lái)其已經(jīng)發(fā)展成為邊緣計(jì)算中一個(gè)重要的計(jì)算架構(gòu),也是FPGA廠商在著力打造的一個(gè)產(chǎn)品線。比如AMD的Zynq?UltraScale+TM MPSoC器件就是其中的代表作。(如圖2所示)


30.jpg

圖2:Zynq?UltraScale+TM MPSoC平臺(tái)框圖

(圖源:AMD)


加速自適應(yīng)計(jì)算的應(yīng)用開發(fā)


顯而易見,自適應(yīng)計(jì)算SoC可以為用戶帶來(lái)三重自由度,即軟件可編程能力、硬件可編程能力以及嵌入式平臺(tái)的可擴(kuò)展能力。


不過(guò)這種“自由度”對(duì)開發(fā)者來(lái)講也是一把“雙刃劍”——它們雖然比其他嵌入式計(jì)算架構(gòu)更加靈活,但也會(huì)令開發(fā)變得更加復(fù)雜。這種復(fù)雜性來(lái)自兩個(gè)方面:其一,F(xiàn)PGA的設(shè)計(jì)開發(fā)流程本身就有較高的門檻,能夠熟練掌握的開發(fā)者并不多;其二,基于異構(gòu)平臺(tái)的整體優(yōu)化,往往需要多個(gè)團(tuán)隊(duì)之間的協(xié)同工作,使得開發(fā)時(shí)間和成本不易掌控。


因此,雖然自適應(yīng)計(jì)算SoC對(duì)性能的“加速”能力顯而易見,但是想讓其應(yīng)用開發(fā)過(guò)程也得以“加速”,并不是一件簡(jiǎn)單的事。


不過(guò),聰明的工程師們總有辦法讓“不簡(jiǎn)單”的事情變簡(jiǎn)單。在“為自適應(yīng)計(jì)算應(yīng)用開發(fā)加速”這件事兒上,AMD的工程師就為開發(fā)者們提供了一個(gè)可行而高效的方法——基于自適應(yīng)系統(tǒng)模塊(SOM)的解決方案。


所謂SOM,想必大家不會(huì)陌生,這是一個(gè)集成了內(nèi)核芯片以及外圍的存儲(chǔ)器、IO接口等功能電路的完整計(jì)算系統(tǒng),它通常不是獨(dú)立使用的,而是要通過(guò)連接器插入到母板(即一個(gè)更大型的邊緣應(yīng)用系統(tǒng))中實(shí)現(xiàn)一個(gè)特定的完整應(yīng)用。


SOM為開發(fā)者帶來(lái)的好處,歸納起來(lái)主要有三點(diǎn):


#1 首先,SOM都是經(jīng)過(guò)嚴(yán)格調(diào)試、測(cè)試和驗(yàn)證的產(chǎn)品,因此開發(fā)過(guò)程不必從更為底層的芯片進(jìn)行,可以節(jié)省大量的時(shí)間和成本。


#2 其次,SOM具有很強(qiáng)的可擴(kuò)展性,插入不同的系統(tǒng)板,即能實(shí)現(xiàn)定制的方案,這就為系統(tǒng)設(shè)計(jì)帶來(lái)了更強(qiáng)的靈活性與易用性。


#3 此外,SOM是可量產(chǎn)化的,在性價(jià)比、可靠性等方面都經(jīng)過(guò)了全面的優(yōu)化,因此使用在批量的商用產(chǎn)品中完全沒(méi)有問(wèn)題。


而上面這些優(yōu)勢(shì),正是自適應(yīng)計(jì)算應(yīng)用開發(fā)中面臨的“痛點(diǎn)”,因此設(shè)計(jì)一個(gè)自適應(yīng)SOM,并利用其為自適應(yīng)計(jì)算提速,為邊緣AI方案賦能,也就成了駛上邊緣AI“高速公路”的關(guān)鍵“入口”。


AMD的自適應(yīng)SOM


AMD的Kria K26 SOM就是大家在駛?cè)脒吘堿I快車道時(shí),在尋找的這個(gè)關(guān)鍵“入口”。


31.jpg

圖3:Kria K26 SOM

(圖源:AMD)


該SOM基于Zynq UltraScale+ MPSoC架構(gòu),內(nèi)置一個(gè)64位的四核Arm Cortex-A53應(yīng)用處理器組,并配套一個(gè)32位的雙核Arm Cortex-R5F實(shí)時(shí)處理器和一個(gè)Arm Mali-400MP2 3D圖形處理器。SOM上還包括4GB的64位DDR4存儲(chǔ)器和QSPI與eMMC存儲(chǔ)器。


Kria K26 SOM可提供25.6萬(wàn)個(gè)系統(tǒng)邏輯單元、1,248個(gè)DSP、26.6Mb的片上內(nèi)存。這使得用戶能夠獲得豐富的資源和設(shè)計(jì)自由度,以實(shí)現(xiàn)不同應(yīng)用中的視覺(jué)功能以及可編程邏輯中額外的機(jī)器學(xué)習(xí)預(yù)處理和后處理硬件加速功能。


此外,該SOM還為H.264/H.265提供了內(nèi)置的視頻編解碼器,可支持高達(dá)32個(gè)編碼、解碼并發(fā)流,只要視頻總像素在60FPS下不超過(guò)3840 x 2160P。


32.jpg

圖4:Kria K26 SOM框圖

(圖源:AMD)


在安全性方面,Kria K26 SOM采用Zynq UltraScale+架構(gòu)內(nèi)置的硬件可信根實(shí)現(xiàn)的固有的安全啟動(dòng)功能,通過(guò)外部TPM2.0擴(kuò)展用于測(cè)量啟動(dòng)并遵循IEC 62443規(guī)范。


此外,出色的I/O靈活性也是Kria K26 SOM一大亮點(diǎn)——它擁有大量的1.8V、3.3V單端與差分I/O,四個(gè)6Gb/s收發(fā)器和四個(gè)12.5Gb/s收發(fā)器,便于SOM支持更多的圖像傳感器以及多種傳感器接口類型,其中包括通常ASSP和GPU不支持的MIPI、LVDS、SLVS 和SLVS-EC。


此外,用戶還能通過(guò)可編程邏輯實(shí)現(xiàn)DisplayPort、HDMI、PCIe、USB2.0/3.0等標(biāo)準(zhǔn),以及其他用戶自定義的標(biāo)準(zhǔn)。


在外形上,Kria K26 SOM的尺寸為77mm x 60mm x 11mm,緊湊的外形非常便于集成到系統(tǒng)中,且根據(jù)規(guī)劃,未來(lái)AMD還將推出更小尺寸的SOM。目前Kria K26 SOM分為商用級(jí)和工業(yè)級(jí)兩個(gè)版本,用戶可以根據(jù)終端應(yīng)用的需要進(jìn)行選擇。


1684919867347829.png

圖5:商用級(jí)和工業(yè)級(jí)K26 SOM特性比較

(圖源:AMD)


Kria K26 SOM帶來(lái)的價(jià)值


使用Kria K26 SOM會(huì)是一種什么樣的體驗(yàn)?在設(shè)計(jì)實(shí)戰(zhàn)中,Kria K26 SOM的表現(xiàn)如何?想必這是大家都關(guān)心的問(wèn)題。


首先,從簡(jiǎn)化硬件設(shè)計(jì)流程來(lái)看,與傳統(tǒng)的基于器件的設(shè)計(jì)相比,基于SOM的設(shè)計(jì)省去了RTL/硬件設(shè)計(jì)、器件調(diào)試、電路板設(shè)計(jì)等環(huán)節(jié),直接從系統(tǒng)級(jí)設(shè)計(jì)開始,因此可以大大簡(jiǎn)化開發(fā)流程——據(jù)AMD的分析,基于SOM的設(shè)計(jì)可以縮短新產(chǎn)品上市時(shí)間多達(dá)9個(gè)月!


1684919850924566.png

圖6:基于SOM的設(shè)計(jì)與基于芯片的設(shè)計(jì)過(guò)程相比,可以縮短新產(chǎn)品上市時(shí)間多達(dá)9個(gè)月(圖源:AMD)


在硬件性能方面,在AMD提供的一個(gè)汽車車牌識(shí)別(ANPR)應(yīng)用案例中,基于Kria K26 SOM的解決方案出色地完成了包含視頻解碼、圖像預(yù)處理、機(jī)器學(xué)習(xí)(檢測(cè))和OCR字符識(shí)別在內(nèi)全流程的加速和優(yōu)化,與采用GPU架構(gòu)的SOM方案相比,在計(jì)算性能、能效表現(xiàn)、以及每視頻流成本上都有明顯的優(yōu)勢(shì)(如圖7)。相信隨著K26 SOM應(yīng)用的擴(kuò)展,其在性能上的潛質(zhì)也會(huì)被越來(lái)越多地挖掘出來(lái)。


1684919836660828.jpg

圖7:在ANPR案例中,K26 SOM表現(xiàn)出明顯性能優(yōu)勢(shì)(圖源:AMD)


特別值得一提的是,Kria K26 SOM除了可以為硬件開發(fā)者帶來(lái)諸多好處,對(duì)軟件開發(fā)者也是一個(gè)福音。隨著與Kria K26 SOM配套的邊緣AI軟件工具、庫(kù)和框架的發(fā)展,一些設(shè)計(jì)團(tuán)隊(duì)可以在無(wú)需硬件工程師介入的情況下使用自適應(yīng)計(jì)算。


對(duì)于軟件開發(fā)者而言,Kria K26 SOM和AMD提供的綜合軟件平臺(tái),可以使其在熟悉的Python、C++、TensorFlow和PyTorch等環(huán)境下進(jìn)行開發(fā),為其提供易于使用、開箱即用的體驗(yàn)。再加上AMD生態(tài)系統(tǒng)中第三方軟件廠商資源的支持,更是可以讓邊緣AI開發(fā)的性能和靈活性提升到一個(gè)更高的水平。


快速體驗(yàn)Kria K26 SOM


為了方便開發(fā)者快速體驗(yàn)到Kria K26 SOM的強(qiáng)大能力,挖掘Kria K26 SOM的價(jià)值,AMD針對(duì)一些典型的邊緣AI應(yīng)用,還提供了開箱即用的入門級(jí)開發(fā)套件。


Kria KV260是專為視覺(jué)應(yīng)用而開發(fā)的視覺(jué)AI入門套件,它配有非生產(chǎn)版本的Kria K26 SOM,以及安裝有風(fēng)扇散熱器的評(píng)估載板,可通過(guò)onsemi成像器訪問(wèn)系統(tǒng)(IAS)和Raspberry Pi連接器提供多攝像頭支持。該開發(fā)套件還可由PMOD擴(kuò)展支持豐富的傳感器模塊。


基于KV260視覺(jué)AI入門套件,軟硬件開發(fā)人員無(wú)需FPGA經(jīng)驗(yàn),即可在1小時(shí)內(nèi)啟動(dòng)和運(yùn)行應(yīng)用程序,進(jìn)而在Kria K26 SOM上快速實(shí)現(xiàn)視覺(jué)AI應(yīng)用的批量部署。


36.jpg

圖8:Kria KV260視覺(jué)AI入門套件

(圖源:AMD)


Kria KR260機(jī)器人入門套件是AMD新推出的一款基于Kria K26 SOM的開發(fā)平臺(tái),它具有高性能接口和原生ROS 2支持,旨在為機(jī)器人和嵌入式開發(fā)人員提供快速簡(jiǎn)便的開發(fā)體驗(yàn)。


該開發(fā)套件包括Kria K26 SOM、載板和散熱系統(tǒng),以及電源解決方案、多個(gè)以太網(wǎng)接口、SFP+連接、SLVS-EC傳感器接口和microSD卡,其目標(biāo)應(yīng)用包括工廠自動(dòng)化、通信、控制和視覺(jué),特別是機(jī)器人和機(jī)器視覺(jué)應(yīng)用。


37.jpg

圖9:Kria KR260機(jī)器人入門套件

(圖源:AMD)


本文小結(jié)


云計(jì)算已經(jīng)深刻改變了IT和IoT世界的格局,而邊緣計(jì)算的興起正在重塑新的游戲規(guī)則。在這一趨勢(shì)中,如何讓越來(lái)越多的邊緣AI應(yīng)用快速落地,需要一種不同以往的計(jì)算平臺(tái),以及與之相適應(yīng)的開發(fā)方法。自適應(yīng)SOM也就應(yīng)運(yùn)而生了。


AMD的Kria K26 SOM可以讓你的邊緣AI開發(fā)駛上快車道,并沿著這條高速公路,將邊緣AI應(yīng)用范圍延伸至到更廣闊的領(lǐng)域。想要快速起步,即刻上路,就來(lái)貿(mào)澤電子網(wǎng)站中的Kria K26 SOM專題深入了解一下吧!



免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系小編進(jìn)行處理。


推薦閱讀:


智慧城市中值得關(guān)注的節(jié)能技術(shù)

RA6T2無(wú)傳感器矢量控制應(yīng)用筆記 [1] 概述

安裝即遺忘:1kW AC/DC轉(zhuǎn)換器安靜工作!

使用基于Raspberry Pi的DDS信號(hào)發(fā)生器實(shí)現(xiàn)精確RF測(cè)試

高精度60V電池電量監(jiān)測(cè)系統(tǒng)這樣打造!

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉