




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
FPGA如何擁抱AI大時代呢?導讀FPGA自上世紀80年代被發(fā)明以來,已經在通信、數(shù)字信號處理、集成電路設計、視頻圖像處理等領域大放異彩。近年來,隨著AI的飛速發(fā)展,這一擁有低延遲、低功耗、靈活高效等優(yōu)勢的可編程硬件,已經成為算法加速中的重要一環(huán),為AI算法的部署提供了更多的可能性。隨著海量數(shù)據(jù)的算力需求越來越高,F(xiàn)PGA芯片將繼續(xù)向更高密度、更高通信帶寬方向發(fā)展,此外,異構計算融合等形式將越來越受推崇。并且從軟件發(fā)展角度,也更注重配套的工具能力,提供高性能的AI加速能力。01.
FPGA在AI芯片市場占比不足1%高算力需求催生了AI芯片興起,“無芯片,不AI”,以AI芯片為載體實現(xiàn)的算力成為人工智能發(fā)展水平的重要衡量標準。廣義上,AI算力芯片指的是專門用于處理AI應用中大量計算任務的芯片,包括GPU、FPGA、ASIC、NPU等AI加速芯片。其中,GPU基于強大的并行計算能力,在圖形圖像處理、復雜的數(shù)學計算等場景,可較好支持高度并行的工作負載。
IDC數(shù)據(jù)顯示,2022年中國AI芯片市場,GPU占比約89.0%,ASIC、FPGA、NPU等芯片市場占有率共計超過10%,其中,F(xiàn)PGA占比僅為0.4%。
圖:中國人工智能芯片市場規(guī)模占比
在前景廣闊的AI芯片領域,F(xiàn)PGA作為一種靈活可編程的硬件平臺,具備較高的計算性能和可定制性,能夠提供對AI算法的加速和優(yōu)化;在AI應用中,可以用于實現(xiàn)神經網(wǎng)絡加速器、高性能計算單元等,為計算密集型的AI任務提供高性能和低延遲的計算能力。但為什么占有率如此低?未來的增長點有哪些?
一直以來,F(xiàn)PGA的設計和開發(fā)相對復雜,需要專門的硬件設計和編程技能;此外,與專用AI芯片相比,F(xiàn)PGA在功耗和性能比方面并無顯著優(yōu)勢,這在一定程度上影響了FPGA在AI方案中的采用。
不過,F(xiàn)PGA廠商逐年加大在AI領域的發(fā)力,例如推出專門針對AI應用的平臺和解決方案,提供了更加易用和高性能的產品。同時,開發(fā)工具和框架的不斷完善,也降低了使用FPGA實現(xiàn)AI特性的門檻,吸引了更多的開發(fā)者和企業(yè)采用FPGA技術。
02.
面向AI,F(xiàn)PGA軟硬兼修
還在2018年左右,Xilinx(現(xiàn)已被AMD收購)已經洞察到了FPGA在算力市場的巨大價值,提出了“數(shù)據(jù)中心優(yōu)先”的戰(zhàn)略,隨后發(fā)布了自適應計算加速平臺(AdaptiveComputeAccelerationPlatform,ACAP)Versal。這一產品形態(tài)已經脫離了傳統(tǒng)的FPGA范疇,通過內部的可編程引擎,它引入多個以自適應數(shù)據(jù)流的方式來組織的AICore,作為承載AI等數(shù)據(jù)密集型運算的主體。
也就是說,XilinxFPGA的AI路線相當于是設計了一套專門的硬件體系來承載AI等數(shù)據(jù)密集型運算,VersalACAP整合了標量處理引擎、自適應硬件引擎和智能引擎以及前沿的存儲器和接口技術,從而在異構加速性能方面得以提升。
不同于Xilinx通過獨立于傳統(tǒng)FPGA結構之外的獨立硬件組成單元(AICore陣列)承載AI,IntelFPGA的AI技術路線相對保守,主要是將嵌入在FPGA內部的DSP模塊直接升級為AI張量模塊,但它依然是FPGA內部的組成模塊之一。
在傳統(tǒng)的FPGA中,乘累加主要依靠DSP模塊實現(xiàn)。為了追求較高的靈活性,普通的DSP模塊就是一兩個乘法器、外加一個加法器構成。這樣就可以基于這種基本的DSP模塊配合FPGA的其它部分構成各種不同的運算算法。
由于AI算法的核心是大量的乘加/乘累加,不是一般的乘加,而是一種“張量”運算。因此提升FPGA執(zhí)行AI算法的方法,自然就是把DSP模塊升級為更加適應AI張量運算的模塊,這也正是Intel的技術路線。
Intel第一款采用張量模塊的FPGA是2020年推出的Stratix10NX,其張量模塊架構主要針對AI計算中常用的矩陣-矩陣或矢量-矩陣乘法和加法運算進行了優(yōu)化,當時可支持INT8和INT4數(shù)據(jù)計算,并通過共享指數(shù)支持FP16和FP12塊浮點的數(shù)字格式。
采用AI張量模塊的增強型DSP引入了兩種全新的重要運算:面向AI的張量處理能力和面向信號處理應用的復數(shù)支持,此類應用包括快速傅里葉變換(FFT)和復雜有限脈沖響應(FIR)濾波器等。第一種模式可通過INT8張量模式增強AI。
第二種新模式是復數(shù)運算,過去復數(shù)乘法需要兩個DSP模塊,但優(yōu)化后,一個采用AI張量模塊的增強型DSP就可以進行16位定點復數(shù)乘法運算。這些創(chuàng)新不僅為IntelFPGA的發(fā)展奠定基礎,也成為Intel近年來面向邊緣AI領域的重要支撐。
Xilinx和Intel這兩種路線也是FPGAAI化的主要技術路徑,特別是Xilinx這種高度可配置、可擴展的架構設計,成為FPGA當前進行異構融合設計的主流方式。
軟件方面,HLS(HighLevelSynthesis,高層次綜合)技術是近年來各大FPGA學術會議上,學術界和工業(yè)界研究最集中的領域之一。HLS將諸如C++、OpenCL等高層語言,通過特定編譯工具可以直接轉化成FPGA上可以運行的硬件代碼,AMD和Intel都有各自的HLS工具和開發(fā)套件。
此外,開發(fā)工具鏈近年來也越來越豐富,包括集成開發(fā)環(huán)境(IDE)、仿真器、調試器等,這些工具可以幫助開發(fā)者在FPGA上開發(fā)、調試和驗證AI應用,提高開發(fā)效率和質量。
03.
邊緣AI,中端FPGA潛能巨大
根據(jù)性能、成本、尺寸等因素,可以將FPGA產品劃分為分為小型、中型和大型FPGA,對應市場上通常所說的低、中、高端應用。低端FPGA具有低功耗、低成本和小體積優(yōu)勢,適用于邊緣計算和IoT設備中。由于邊緣計算要求在設備端進行實時的數(shù)據(jù)處理和決策,低端FPGA適合在邊緣設備中實現(xiàn)AI推理任務。例如,用于智能攝像頭、智能家居設備、傳感器節(jié)點等,實現(xiàn)圖像識別、語音識別和運動檢測等功能。此外,低端FPGA還可以用于小規(guī)模的機器學習模型訓練和優(yōu)化。
中端FPGA在AI領域的機會較為廣泛,由于具有較高的性能和資源,它適合處理更復雜的AI任務,例如在圖像和視頻處理、自動駕駛、工業(yè)自動化等領域,可用于加速計算、優(yōu)化算法和實現(xiàn)實時推理。同時,中端FPGA還可以與其他硬件加速器結合使用,構建混合加速平臺,實現(xiàn)更高效的AI計算。
高端FPGA在AI領域的機會則主要集中在高性能計算和數(shù)據(jù)中心加速方面,它具有大規(guī)模的邏輯資源、高存儲容量和高時鐘頻率,能夠支持更復雜和大規(guī)模的AI模型訓練和推理任務。
隨著AI應用越來越多轉向比集中式云數(shù)據(jù)中心更低的延遲、更安全和私密的處理,高端FPGA特性延伸到中端應用的趨勢非常明顯,網(wǎng)絡邊緣計算、智能終端設備等市場呈現(xiàn)出巨大的發(fā)展?jié)摿Γ瑖鴥韧庀嚓P廠商紛紛加大了中端FPGA領域的布局。
工業(yè)攝像頭就是很好的應用案例之一。工業(yè)攝像頭由于體積小、散熱條件不佳,但對帶寬要求越來越高,屬于典型的“既需要一定性能、又要求低功耗”的應用。此外還有汽車ADAS包括MDC方面的應用,以及汽車顯示等方面,都越來越需要更強的處理能力、更高的處理帶寬。中端FPGA的低功耗、高性能就非常適合這類應用。
之前專注于低功耗FPGA的Lattice,近年來就在加大中端FPGA的布局,其策略可以解讀為“通過基于專用平臺的方法來滿足市場需求”。在該公司看來,市場上的許多中端FPGA器件都是采用大型FPGA的架構開發(fā)的,其底層架構保持不變,只是某些功能發(fā)生了變化。由于這些架構主要是為高性能計算應用而設計的,因此這種方法會導致優(yōu)化不佳,尤其是在功耗和物理尺寸方面。
相比以前擁有100K~150K邏輯單元的FPGA產品,Lattice推出了邏輯單元數(shù)量500K的FPGA產品,同時在互聯(lián)性能、封裝尺寸、性能方面進行了優(yōu)化,使之更適合中端應用需求。
Intel也開始重視中端FPGA的市場機會,盡管前幾年,英特爾推出的FPGA產品都更側重高端應用市場,但隨著AgilexD系列FPGA和代號SundanceMesa的AgilexFPGA的推出,Intel將會更多關注中端應用市場。
還有一個值得注意的趨勢,就是“高端和中端FPGA之間的界限越來越趨于模糊。過去幾年,中端FPGA應用發(fā)生了很大變化,目前已經演進為需要更高的性能和更低的功耗,高端FPGA將延伸到中端應用中;與此同時,一些低端應用又對產品有更高需求。這就意味著,需要打造具備更低功耗和密度的產品。
國產FPGA廠商也開始面向AI進行創(chuàng)新。京微齊力近期就宣布在其FPGA中采用了Imagination的Series3NXAI核,以適用于AIoT應用、邊緣端AI視頻分析處理應用等。京微齊力這一做法是將FPGA、CPU、AI等多種異構計算單元集成在同一個芯片上,強調了“硬件的可重構特性”,這種混合架構的平臺芯片比單一架構更能支持高定制水平和能效提升。
04.
寫在最后
FPGA的關鍵價值在于可編程性、靈活性,AI發(fā)展初期,很多新興應用還在醞釀中,各類標準仍在演進,AI算法也在不斷推陳出新,對于硬件的算力和靈活度要求很高,F(xiàn)PGA剛好契合這些需求。此外,在推理環(huán)節(jié)的小批量數(shù)據(jù)處理中,F(xiàn)P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 怎么簽署轉讓合同協(xié)議書
- 康復醫(yī)學科設備分類體系
- 網(wǎng)紅飲品品牌授權與知識產權保護合同
- 高管股權激勵計劃績效評估及合作協(xié)議
- 生態(tài)草原牧場養(yǎng)殖與資源保護合作協(xié)議
- 公共設施建筑給排水系統(tǒng)安裝與水質壓力檢測合同
- 動畫電影制作與全球發(fā)行外包服務合同
- 海外集裝箱實時追蹤租賃服務合同
- 國際訴訟文件安全快遞及全額賠償附加協(xié)議
- 澳新市場股權合作開發(fā)與文化產業(yè)投資協(xié)議
- 自動噴水滅火系統(tǒng)質量驗收項目缺陷判定記錄
- 人教版一年級起點小學二年級英語下冊全套教案
- T-CCIAT 0043-2022 建筑工程滲漏治理技術規(guī)程
- 供貨、安裝、調試、驗收方案
- 電氣設備-開篇緒論匯編
- 婚無遠慮必有財憂法商思維營銷之婚姻篇74張幻燈片
- 紅外圖像處理技術課件
- 小學一年級人民幣學具圖片最新整理直接打印
- 運動負荷參考曲線
- 電梯快車調試方法
- 醫(yī)院病種分析系統(tǒng)操作手冊
評論
0/150
提交評論