AI大模型對智能汽車產業的影響_第1頁
AI大模型對智能汽車產業的影響_第2頁
AI大模型對智能汽車產業的影響_第3頁
AI大模型對智能汽車產業的影響_第4頁
AI大模型對智能汽車產業的影響_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

AI大模型對智能汽車產業的影響第七屆國際絲路新能源與智能網聯汽車大會9月23日|西安

3

AI大模型對汽車產業鏈的影響ChatGPT與AI大模型AI大模型在汽車業的應用2目錄1(單位:

月)21326SnapchatFacebook2022年11月

,美國科技公司Open

AI發布ChatGPT,

因能很好地與人實現互動而迅速成為爆款產品:上線5天用戶過100萬

,2個月后用戶就突破1億

,成為歷史上用戶數增長最快的消費者應用。各明星應用程序注冊用戶達1億時間ChatGPT可回復自然語言輸入的問題ChatGPT,突然出現的爆款資料來源:

OpenAI公司,英偉達公司InstagramChatGPTTikTok4239GPT-315億參數量2019年2月1,750億參數量2022年7月ChatGPT(ChatGenerativePre-trainedTransformer)

,是一種適用于自然語言交流的人工智能大模型,

它成功的關鍵之一

,是Open

AI使用了海量數據進行預訓練。5年間

,GPT的參數量已從億級飆升至萬億級。據不完全統計,

目前已發布的國內大模型中:參數量超過10億的有79個,其中,參數量最高的達到174萬億。GPT-4四代GPT參數量變化ChatGPT成功關鍵之一:大參數GPT-2GPT-118,000億參數量1.17億參數量資料來源:

OpenAI公司,新汽車研究所制圖2023年3月2018年6月ChatGPT取得成功的另一個關鍵

,是使用了Transformer模型。該模型采用自注意力(self-attention)機制

,其優點在于并行度高

,可一次性處理所有輸入數據

,使ChatGPT能對詞語序列的概率分布進行建模

,利用上下文信息預測后續詞語出現的概率分布。三種常見模型的特點對比ChatGPT成功關鍵之二:新模型CNN模型只能對標注過的物體進行相似度的比對RNN模型無法進行并行計算,效

率嚴重受限。Tf模型可找到更泛華的相似規律,

或者說,它的聯想能力更強。卷積神經網絡模型(CNN)循環神經網絡模型(RNN)Transformer模型資料來源:

《動手學深度學習》

(李沐)2020年

,微軟亞洲研究院首次將Tf模型應用于圖像分類任務

,在評測中實現88.55%的準確率。而且Tf模型在數據量越大的情況下表現越好

,特別適用于自動駕駛這類大規模數據訓練場景。Transformer模型可將2D圖像融合成3D視角Transformer模型的工作原理Tf模型的另一個重要用處:計算機視覺資料來源:《AttentionIsAllYou

Need》、《Safety-EnhancedAutonomous

Driving

Using

Interpretable

Sensor

Fusion

Transformer》AI大模型在汽車業的應用

3

AI大模型對汽車產業鏈的影響

ChatGPT與AI大模型1目錄2級別名稱定義駕駛操作環境感知支援系統作用域0無自動化?由駕駛者完全操控汽車駕駛者駕駛者駕駛者無1駕駛支援?

系統有時能夠輔助駕駛者完成方向盤和加減速等駕駛操作駕駛者與

系統部分行駛任務2部分自動化?

系統能夠完成某項駕駛任務?

駕駛者需要監控駕駛環境?

其余駕駛操作由駕駛者完成駕駛者與

系統3條件自動化?

系統負責某些情況下環境感知?

駕駛員需要時刻準備取回駕駛控制權系統系統4高度自動化?

系統能夠進行環境感知?

駕駛員不需重新取得駕駛控制權?

系統只能在特定環境條件下運行系統全部行駛任務5完全自動化?

系統能夠完成所有環境條件下的所有駕駛任務自動駕駛是過去10年最火熱的賽道

,但直到2022年才有部分企業推出具備L3級功能的車型。究其原因,

除法規發展落后于產業發展外

,很重要的一點在于自動駕駛系統積累的數據量還不夠

,存在安全隱患。SAE對自動駕駛的分級標準自動駕駛近年來一直未能進入L3時代資料來源:

SAEJ3016-2018100億公里馬斯克曾在推特點贊了這樣的觀點:實現超越人類的自動駕駛能力至少需要100億公里駕駛數據。1000億公里自動駕駛初創公司MOMENTA在其公眾號上提出:要實現L4級駕駛,至少需要千億公里駕駛數據。我國2022年公里旅客運輸周轉量道路交通具有場景復雜、參與者多、場景異質性強等特點

,存在大量不可預見性。為避免長尾問題

,廠商需要對車輛自動駕駛系統進行大量測試

,以確保盡可能多地覆蓋場景

,但也會帶來成本的大幅增加。

業界對L4級別自動駕駛所需測試數據的預估

為解決長尾問題,測試數據需達10億~1000億公里資料來源:廣汽集團,案頭研究2400億人工智能大模型在汽車業的應用

,首推它對自動駕駛的賦能

,主要體現為城市導航輔助駕駛系統(城市NOA)的量產應用上。從2022年Q3起,

國內外智能汽車頭部企業開始應用投放各自的城市NOA系統。

智能汽車頭部公司NOA系統發展概況

AI大模型將從根本上改變自動駕駛產業的發展資料來源:中信證券硬件配置方面

,需要車輛使用滿足L3級自動駕駛功能的智能化傳感器

,如攝像頭、激光雷達、毫米波雷達等,能實時感知各類路面情況;還需要車輛的自動駕駛芯片有足夠高的算力

,能在毫秒之內識別信息

,并提出應

對策略。

應用智能傳感器是實現NOA的基礎

無論是多傳感器融合派廠商,還是視覺派廠商,都大量使用智能化傳感器,他們是實現NOA的必要條件。要實現NOA對智能傳感器硬件要求很高特斯拉Model

3小鵬G9廠商要搭建起高效的算法模型

,開發的系統既要能精準識別并處理各傳感器獲得的數據

,還要能有效應對模型未考慮到的長尾問題。這大大增加了系統所需數據量

,增加了開發難度。特斯拉的NOA系統不僅能規劃車輛行進路線等,還會實

時提供預警信息,并能主動停止可能導致危險發生的并線

等行為。小鵬汽車開發的城市NGP的代碼量

感知模型數量、

預測/規劃/控制相關代碼量,分別是其高速NGP是6倍、4倍

和88倍。

軟件在NOA系統中起決定性作用

要實現NOA還需要高水平算法的支持2021年

,特斯拉在其AI

Day上宣布將基于BEV+Tf架構開發其新版的完全自動駕駛系統(FSD)

,并于當年開始重新編寫底層代碼

,成為在汽車業第一個使用AI大模型的主流廠商。

新架構下特斯拉自動駕駛軟件的融合效果

下圖:

BEV+Tf架構下,

特斯拉自動駕駛軟件對

上圖感知結果進行融合

后的效果。特斯拉率先在汽車業應用AI大模型上圖:攝像頭獲得的車

輛左、

中、右三方的感

知結果(即路況)。資料來源:特斯拉2021AI

Day傳統算法將自動駕駛系統劃分為感知、規劃、控制等3大塊

,每個部分又可細分為不同的模塊和子模塊。每個模塊各司其職

,有著獨立且明確的目標。規劃模塊的作用主要是根據車輛實際行駛時面臨的實時交通環境,生成對應的行進規劃,如跟車、

加速、換道、制動等。控制模塊的作用是操縱車輛,協調

車輛的動力系統、

制動系統等,按

照規劃模塊輸入行進規劃,實施駕

駛行為。感知模塊的作用主要有3點:?

識別周邊物體,?

檢測交通信號,?

明確物體坐標,傳統的自動駕駛算法框架傳統的自動駕駛算法是基于規則開發的 控制模塊 規劃模塊

感知模塊類別優點缺點模塊化方案?

由眾多子模塊組成,每個對應特定的任務和功能;?

可解釋性強,每個獨立模塊負責單獨的子任務,便于問題回溯,

易于調試等。?

存在多個編解碼環節,會產生計算的冗余浪費,對算力要求高,需要使用激光雷達、

高清地圖,成本高企;?

存在信息損失和誤差問題。?

長尾部分需一事一議,會

耗費大量精力解決。端到端方案?

輸入感知信息,直接生成控制決策信號,更接近人的駕駛習慣;?

可借助數據的多樣性獲得不同場景下的泛用性;?

減少感知、決策等中間模塊的訓練過程,可集中模型訓練資源。?

黑盒模式,

解釋性差,

系統出現錯誤時,難以判斷是哪個隱藏層或神經元的問題;?

閉環驗證較難,缺少真實數據驗證。應用AI大模型后,

自動駕駛算法的底層邏輯將變成“場景→車輛控制

”的端到端模型

,將感知、規劃和控制環節一體化

,傳感器采集到的信息直接輸入神經網絡

,經過處理后直接輸出自動駕駛的駕駛命令

,不存在各

子模塊目標與總系統目標存在偏差的情況

,保證效益最大化。當前

,端到端模型暫時只被用于感知系統。基于數據的AI大模型將徹底改變自動駕駛算法的底層邏輯模塊化與端到端方案對比端到端模型資料來源:新汽車研究所繪制感知

模塊規劃模塊控制

模塊鳥瞰圖(BEV,

Bird‘s

Eye

View)

,是利用算法將各傳感器獲取的二維信號轉換成類似直升機俯視視角的三維坐標

,可在感知算法的層面實現端到端的架構開發。優點

通過融合多個視角解決遮擋和物體重疊問題,解決多傳感器融合問

題,方便下游任務共享圖像特征;

在BEV視角下沒有物體變形問題,使得模型集中精力解決分類問題;

能夠把傳統感知方案中3D目標檢測、

障礙物實例分割、

車道線分割、軌跡預測等多項任務在一個算法框架內實現,大幅減少人力需求,提升算法開發效率。缺點

鳥瞰圖是基于2D信號合成的,

缺少高度信息,無法真實反映出物體在3D空間實際的占用體積是多少。

為解決這一問題,算法通過矩形框進行標記,這導致了細節損失。

對于未被預訓練過的物體,

系統無法識別。圖片來源:特斯拉2021AI

Day鳥瞰圖,

一種新的融合算法2022年

,特斯拉推出OccupancyNetworks(占用網絡)感知技術

,通過算法對物理世界進行數據化和泛化建模

,在3D空間上測出不同物體的高度

,賦予鳥瞰圖算法高度信息。的概率,無需考慮這個物體到底是什么,只考慮網格是否被占用。規則外形障礙物的感知能力,大幅提升了模型的泛化能力。圖片來源:特斯拉2022AI

Day占用網絡感知技術,特斯拉給BEV算法打的補丁占用網絡感知技術原理基本的思想是將三維空間分成若干個網格,再去預測每個網格被占用擺脫了神經網絡算法需先

“認識

”才能

“識別”的特性,大大增強了對不自動駕駛感知模塊有視覺派、融合派2種技術路線

,前者以攝像頭為主傳感器

,后者以激光雷達為主傳感器。應用AI大模型降低了硬件的要求

,及軟件開發的成本。毫末智行:

單張圖的標注成本從5元下降到0.5元

,成本下降90%。小鵬汽車:

2000人年的

標注量,可在16.7天完成,

效率提升4.5萬倍。大多數廠商選擇多傳感器融合路線,

以激光雷達為主傳感器,輔之以攝

像頭、

毫米波雷達等。圖片來源:特斯拉、毫末智行

AI大模型對自動駕駛成本的影響

車載感知硬件成本降低。

自動標注的效率提升,帶動成本大幅度下降。

大模型的開發成本。

廠商需要新增大量云端

算力。特斯拉FSD

V12利用了

1.4萬個GPU訓練集群

支持AI大模型運算,特斯拉預期其算力規模會在2024年2月進入全

球前五。AI大模型可以大大降低自動駕駛成本特斯拉堅持走視覺路線,其Model

3應用的是8個攝像頭+1個毫米波

雷達的配置方案。自動駕駛能力的提

升需要大量算法訓

練,除真實場景外,

需模擬出大量仿真

場景做補充。如果

僅憑借工程師的理

解設計仿真場景,能模擬的場景數量

有限。而大模型的應用將

使自動泛化成為可

能,生成仿生場景

數據的效率提升,進而加速模型迭代。由于基于規則的算法泛化性不足、仍面臨諸多長尾問題,

目前完善算法的方式是“打補丁

,又會導致最終代碼量龐大且難以維護。AI大模型具備更強的泛化能力

,可大幅度減少長尾效應

,大大提升安全性。傳統自動駕駛方案依靠貼標簽的方式挖掘長尾數據,通常僅能識別已知的圖像類別。而大模型可通過文本將收集到的圖像進行相關性分類,并依照文本描述檢索圖像,

因此有較強的泛化性。AI大模型可大幅減少長尾效應,提高自動駕駛安全性汽車的圖片來源:百度阿波羅,

毫末智行100億公里馬斯克曾在推特點贊了這樣的觀點:實現超越人類的自動駕駛能力至少需要100億公里駕駛數據。1000億公里自動駕駛初創公司MOMENTA在其公眾號上提出:要實現L4級駕駛,至少需要千億公里駕駛數據。2022年,特斯拉的自動駕駛算法已全面切換到AI大模

型。新版FSD的事故率,每行駛百萬英里

(主要是非高速

公路)發生事故的次數是

0.31。NHTSA的數據,美國所有車輛每行駛百萬英里發生

事故的次數是1.53,是FSD的4.9倍。2021年

,特斯拉開始應用大模型重構自動駕駛軟件,

當年7月推送的FSDBetaV9是大模型算法下的版本。2022年的實際測試顯示

,特斯拉L3級自動駕駛系統FSD的安全性能已高于人。

FSD已具備高于人駕駛的安全性

AI大模型驅動下,

L3級自動駕駛的安全性已高于人資料來源:特斯拉,案頭研究

3

AI大模型對汽車產業鏈的影響

ChatGPT與AI大模型AI大模型在汽車業的應用21目錄軟件定義汽車的概念近年來逐步被業界接受

,但更多的還是從產品開發的角度

,強調要重視軟件的功能、作用與價值。

隨著大模型得到更多的應用

,軟件定義汽車的內涵有了新的變化

,后續可能是“數據定義汽車

”。產品開發過程,要從此前的重視硬件轉向重視軟件;整車由硬件主導轉向軟件主導。資料來源:清華大學,麥肯錫軟件功能的不斷增加將推動汽車軟件的市場規模將不斷擴大,成為產業新的增長極。

業界對軟件定義汽車的常見理解

軟件定義汽車有了新的含義自動駕駛功能的不斷升級

,對車用芯片算力的要求越來越高

,用戶需求倒逼上游企業開發出集合AI加速器的系統級芯片(SoC)

,提升車輛的算力。今后的算力將來到云端

,對整車廠商提出更高要求。2021年,蔚來發布新車ET7,該車使用的超算平臺NIO

Adam,配備由四顆英偉達Drive

Orin芯片,平臺總算力高達1016

TOPS,超過特斯拉發布的FSD平臺算力的7倍。為更好地訓練FSD,特斯拉AI計算中心Dojo總計使用了1.4萬個英偉達的GPU來訓練AI模型,使用了14億幀畫面訓練一個神經網絡,對應的是10萬個GPU

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論