【專題】用(yòng)算法定義芯片的地平線(xiàn),堅持開放賦能(néng)
如今,汽車(chē)智能(néng)化的實現與功能(néng)叠代對高性能(néng)汽車(chē)智能(néng)芯片的需求已成為(wèi)行業共識。與此同時,除了外界熟知的汽車(chē)智能(néng)芯片,地平線(xiàn)在創立之初就前瞻性地确定了軟硬融合的技(jì )術路線(xiàn),面向智能(néng)駕駛場景構建了強大的軟件算法能(néng)力。地平線(xiàn)持續緻力于産品技(jì )術創新(xīn)叠代,開放協同産業合作(zuò)夥伴打造智能(néng)汽車(chē)生态。近期,本刊記者與地平線(xiàn)BPU算法負責人羅恒展開對話,圍繞智能(néng)汽車(chē)芯片展開全新(xīn)探索。
地平線(xiàn)BPU算法負責人 羅恒博士
記者:請您介紹貴司概況、主營産品與技(jì )術及發展規模。
羅恒:回顧過往,地平線(xiàn)創下多(duō)個重要發展裏程碑,加速助力中國(guó)汽車(chē)産業智能(néng)化轉型。2017年,地平線(xiàn)推出了中國(guó)首款邊緣人工智能(néng)芯片;2019年,地平線(xiàn)又先後推出中國(guó)首款車(chē)規級AI芯片——征程2、新(xīn)一代AIoT智能(néng)應用(yòng)加速引擎——旭日2。2020年,地平線(xiàn)進一步加速AI芯片叠代,推出新(xīn)一代高效能(néng)汽車(chē)智能(néng)芯片征程3和全新(xīn)一代AIoT邊緣AI芯片平台旭日3。
對于地平線(xiàn)來說,裏程碑式的節點在2021年7月29日,地平線(xiàn)以引領行業的新(xīn)産品繼續開拓汽車(chē)智能(néng)化新(xīn)路徑,正式發布高性能(néng)大算力全場景整車(chē)智能(néng)中央計算芯片征程5。征程5是地平線(xiàn)繼征程2、征程3之後的第三代車(chē)規級産品,單顆芯片AI算力最高可(kě)達128 TOPS,真實AI性能(néng)可(kě)以達到1283 FPS(frames per second),支持16路攝像頭感知計算,毫秒(miǎo)必争高效協同,能(néng)夠支持自動駕駛所需要的多(duō)傳感器融合、預測和規劃控制等需求。随着征程5芯片的發布,地平線(xiàn)成為(wèi)業界唯一能(néng)夠覆蓋從L2到L4全場景整車(chē)智能(néng)芯片方案的提供商。
同時,地平線(xiàn)發布了一系列基于征程系列汽車(chē)智能(néng)芯片打造的智能(néng)駕駛解決方案,包括Horizon Matrix智能(néng)駕駛解決方案以及Horizon Halo車(chē)載智能(néng)交互解決方案,共同打造多(duō)層級的自動駕駛以及持續進化的車(chē)載智能(néng)交互功能(néng)。其中,基于以征程5為(wèi)核心的整車(chē)智能(néng)計算平台,地平線(xiàn)發布集成全場景自動駕駛、車(chē)載人機交互和車(chē)内外聯動體(tǐ)驗于一體(tǐ)的Horizon Matrix SuperDrive整車(chē)智能(néng)解決方案。Horizon Matrix SuperDrive融合47個傳感器,可(kě)互為(wèi)補充,能(néng)夠滿足高速、城區(qū)、泊車(chē)以及智能(néng)人機交互等全場景整車(chē)智能(néng)需求。同時,地平線(xiàn)擁有自動駕駛和車(chē)載智能(néng)交互的量産級解決方案,在統一芯片架構的基礎上,Horizon Matrix SuperDrive可(kě)快速打通車(chē)内外功能(néng),能(néng)夠基于車(chē)外路況和車(chē)内駕駛員狀态融合判斷主動介入;或基于車(chē)内場景感知和理(lǐ)解動态調整駕駛策略,從而建立人機互信,打造智能(néng)化、人性化的人車(chē)共駕新(xīn)體(tǐ)驗。
2020年,地平線(xiàn)正式開啓中國(guó)汽車(chē)智能(néng)芯片的前裝(zhuāng)量産元年,成為(wèi)全球繼Mobileye、英偉達後第三個實現專用(yòng)ADAS芯片規模化量産的廠商。截至目前,地平線(xiàn)征程芯片出貨量已突破100萬片,獲得40多(duō)個前裝(zhuāng)量産項目定點。
記者:群雄并起的競争業态下,芯片企業如何保持核心優勢?
羅恒:科(kē)技(jì )創新(xīn)是引領發展的第一動力,硬核技(jì )術是科(kē)技(jì )企業立身之本。
地平線(xiàn)緻力于研發高性能(néng)大算力車(chē)規級芯片。2021年7月發布的征程5芯片,是地平線(xiàn)繼征程2和征程3開啓中國(guó)車(chē)規級人工智能(néng)芯片量産先河之後的第三代車(chē)規級産品,兼具大算力和高性能(néng)。單顆芯片算力最高可(kě)達128 TOPS,真實AI性能(néng)(自動駕駛核心負載——物(wù)體(tǐ)檢測任務(wù),COCO(業内主流檢測數據集)精(jīng)度(mAP)34.6%可(kě)以達到1283 FPS(frames per second),并且FPS随編譯器優化,後續還有提升空間。
同時,地平線(xiàn)有深厚的算法基因,既是最懂芯片的算法公司,也是最懂算法的芯片公司。地平線(xiàn)對重要場景中的關鍵算法趨勢進行預判,前瞻性地将其計算特點融入到計算架構的設計當中,使AI芯片随着算法演進趨勢,始終能(néng)夠保持極高的有效利用(yòng)率,從而真正意義上受益于算法創新(xīn)帶來的優勢。這一技(jì )術指導思想的集中體(tǐ)現為(wèi)基于實際AI算法需求設計的BPU,例如:搭載BPU3.0貝葉斯架構的征程5可(kě)充分(fēn)匹配高等級自動駕駛的需求,支撐更複雜的感知以及預測、規控功能(néng)。
地平線(xiàn)已經構建起了一支算法、軟件和芯片高效協同的産品研發團隊,具備兩方面獨特的技(jì )術優勢:一是軟硬結合,用(yòng)算法定義芯片并将芯片的性能(néng)發揮到極緻;二是以終為(wèi)始,始終用(yòng)系統的視角審視其中每個模塊的設計與實現。這使得我們提供給客戶的,不僅有自動駕駛芯片,還有開放的算法和軟件支持服務(wù),我們稱之為(wèi)“軟硬結合的開放式解決方案”。
基于自研芯片,地平線(xiàn)打造了地平線(xiàn)SuperDrive全場景智能(néng)駕駛方案,可(kě)支持高速、城區(qū)、泊車(chē)全場景自動駕駛,其背後基于感知中融合的BEV(Bird's eye view)技(jì )術、基于軟件2.0開發範式的4D标注和預測都處于行業前沿,系統領先的算法和軟件能(néng)力将幫助合作(zuò)夥伴更高效的構建智能(néng)駕駛的閉環能(néng)力。
大規模量産是檢驗企業技(jì )術能(néng)力的唯一标準。經過7年的發展,地平線(xiàn)在量産落地上也經受住了市場的考驗,不僅是國(guó)内首個,更是唯一一個實現了車(chē)規級人工智能(néng)芯片前裝(zhuāng)量産的企業。2020年,地平線(xiàn)正式開啓中國(guó)汽車(chē)智能(néng)芯片的前裝(zhuāng)量産元年,實現從0到1的突破,時至目前,地平線(xiàn)征程芯片出貨量已突破100萬片,獲得40多(duō)個前裝(zhuāng)量産項目定點,攜手合作(zuò)夥伴實現從1到N的價值共探。
最後,我很(hěn)想強調的一點是,芯片是大投入、長(cháng)周期的科(kē)技(jì )成果,地平線(xiàn)的營收随着芯片上車(chē)在逐漸提升,但芯片的叠代研發仍然需要很(hěn)大的投入,除了2021年7月在市場上推出的高性能(néng)大算力全場景整車(chē)智能(néng)中央計算芯片——征程5,地平線(xiàn)還在定義下一代芯片,隻有這樣才能(néng)夠保持不斷進步和技(jì )術優勢。在這種長(cháng)周期中地平線(xiàn)近兩年仍會持續投入、培育,并且我相信,随着芯片的不斷上車(chē),羊群效應會使地平線(xiàn)的國(guó)内市場不斷擴張,造血能(néng)力也會越來越強,保持不斷的進步和技(jì )術優勢,形成良性循環。
記者:TOPS已經成為(wèi)車(chē)企最常用(yòng)的算力單位,芯片企業如何為(wèi)客戶提供更強有力的算力支持?
羅恒:一般所說的TOPS是峰值算力,指的是AI芯片每秒(miǎo)運算次數,通常是指Int 8、FP 32、FP 16的乘法和乘法之後的累加。峰值算力是衡量AI芯片能(néng)力重要的指标。
在峰值算力之外,其實用(yòng)戶真正關心的是實際運行AI算法的性能(néng),這個通常是指FPS(某個模型下實際運行時每可(kě)以處理(lǐ)的幀數)、可(kě)用(yòng)算力(FPS*模型理(lǐ)論計算量)。實際性能(néng)意味着客戶使用(yòng)芯片究竟能(néng)實現怎樣的應用(yòng)功能(néng)和效果。
地平線(xiàn)作(zuò)為(wèi)一個新(xīn)晉的玩家,中國(guó)AI芯片領軍企業,有着自己獨特的思考。
地平線(xiàn)有兩個觀點,一個是,算力大,不如“算得快”;一個是,好芯片更要是“好用(yòng)”的芯片。
一方面,算力更高的芯片帶給客戶的不隻是價值,還有成本。一般來說,芯片的成本與其面積大緻成正比,1000 TOPS芯片的成本就是100 TOPS芯片的10倍。因此,芯片算力并不是越高越好,要從性價比的角度判斷客戶究竟需要多(duō)大算力的芯片。另一方面,做企業必須有效平衡現實主義和理(lǐ)想主義,不能(néng)下意識地覺得這兩件事一定是矛盾的。在我看來,我們應該用(yòng)極度現實主義的方法,去努力實現極度理(lǐ)想主義的結果。具體(tǐ)來說,地平線(xiàn)肯定會追求芯片算力的不斷提升,但在量産産品上,我們更注重憑借自身在算力與算法匹配方面的優勢,為(wèi)客戶節省成本、創造價值。
當前智能(néng)汽車(chē)發展的核心瓶頸是算力不足,汽車(chē)智能(néng)芯片成為(wèi)決定競争勝負最重要的籌碼。但受摩爾定律的功耗限制,追求純算力突破并不可(kě)持續,同時算力也并不代表汽車(chē)智能(néng)芯片“真實性能(néng)”,芯片計算效率也同樣需要關注。正如對于汽車(chē)來說,馬力(單位為(wèi)HP)不如百公裏加速時間(單位為(wèi)秒(miǎo))更真實反映整車(chē)動力性能(néng),算力(單位為(wèi)TOPS)并不反映汽車(chē)智能(néng)芯片實際性能(néng),而每秒(miǎo)準确識别幀率FPS才是更真實的性能(néng)指标。
何為(wèi)新(xīn)摩爾定律?在經典摩爾定律時代,大家用(yòng)“PPA”指标來衡量一顆芯片的性能(néng),即 Power、Performance、Area,對應功耗、處理(lǐ)任務(wù)的性能(néng)和芯片成本。在AI芯片時代,需要新(xīn)的範式來定義性能(néng),即新(xīn)摩爾定律,可(kě)以從幾個維度來衡量:單位成本下峰值算力、峰值算力的有效利用(yòng)率,以及有效算力轉化為(wèi) AI 性能(néng)的比率。新(xīn)摩爾定律最早由地平線(xiàn)提出,目前已逐漸成為(wèi)業界共識。
作(zuò)為(wèi)一家算法基因很(hěn)濃的芯片公司,地平線(xiàn)從征程1開始就針對自動駕駛場景設定了獨特的算法模型,并基于對關鍵算法發展趨勢的預判,前瞻性地将其計算特點融入到伯努利、貝葉斯等芯片架構的設計中,從而實現很(hěn)高的計算資源利用(yòng)效率。通常,GPU在跑深度神經網絡算法的時候,算力利用(yòng)率有時會很(hěn)低,而地平線(xiàn)的征程3和征程5則有很(hěn)高的算力利用(yòng)率。反映出來的就是征程5的每秒(miǎo)準确識别幀率(單位為(wèi)FPS)可(kě)以大幅領先GPU。
作(zuò)為(wèi)面向高等級自動駕駛的專用(yòng)處理(lǐ)器架構,貝葉斯架構能(néng)夠保證經過較長(cháng)的研發周期後,征程5芯片在正式推出時仍然能(néng)夠快速适應最新(xīn)的主流算法,并随着算法的叠代,持續提供更高的每秒(miǎo)準确識别幀率,從而使終端用(yòng)戶真正意義上受益于算法創新(xīn)帶來的優勢。
記者:車(chē)輛駕駛過程中,除了保障算力,芯片還要在哪些方面發揮性能(néng)?比如FPS也是業界談及較多(duō)的一點。您認為(wèi)該如何界定與衡量芯片的真實性能(néng)?
羅恒:未來的智能(néng)汽車(chē)就是一台四個輪子上的超級計算機,其中最核心的器件就是汽車(chē)智能(néng)芯片,是智能(néng)汽車(chē)的數字發動機。而制約當前智能(néng)汽車(chē)發展的核心瓶頸就是汽車(chē)智能(néng)芯片的算力不足,算力就好比智能(néng)汽車(chē)的腦容量,自動駕駛每往上走一級,所需要芯片算力就要翻一個數量級,要實現完全自動駕駛,我們需要在四個輪子上搭載天河二号級别的計算能(néng)力。
當前智能(néng)汽車(chē)發展的核心瓶頸是算力不足,汽車(chē)智能(néng)芯片成為(wèi)決定競争勝負最重要的籌碼。受摩爾定律的功耗限制,追求純算力突破并不可(kě)持續,同時算力也并不代表汽車(chē)智能(néng)芯片“真實性能(néng)”,芯片計算效率也同樣需要關注。
在我看來,鋪物(wù)理(lǐ)算力并不真正産生用(yòng)戶價值,物(wù)理(lǐ)算力峰值計算效能(néng)等于晶體(tǐ)管數目乘以主頻,這個由芯片生産商決定,也即車(chē)企的成本;真正的價值應該在于最先進的神經網絡在芯片上面能(néng)夠跑多(duō)快,也即真實AI性能(néng)。
地平線(xiàn)認為(wèi),評估芯片AI性能(néng),本質(zhì)上應該關注做AI任務(wù)的速度和精(jīng)度,即“多(duō)快”和“多(duō)準”。而地平線(xiàn)提出的MAPS評測方法關注真實的用(yòng)戶價值,将每顆芯片在“快”和“準”這兩個關鍵維度上的取舍變化直觀地展現出來,并在合理(lǐ)的精(jīng)度範圍内,評估芯片的平均處理(lǐ)速度。
MAPS的度量單位是FPS,全稱為(wèi)Frame Per Second,即“每秒(miǎo)鍾可(kě)準确識别多(duō)少幀”。更高的FPS,代表着更快速的感知、更低的延時,這意味着更高的安(ān)全性能(néng)和行駛效率。顯然,與TOPS相比,FPS是一個更有價值的性能(néng)指标。
MAPS其實是在物(wù)理(lǐ)算力的基礎上,通過對大量模型的測試,綜合各個模型的速度(FPS,每秒(miǎo)處理(lǐ)幀率)和準确率得到的最佳方案的量化結果。它更聚焦于使用(yòng)戶能(néng)夠通過可(kě)視化的圖表直觀地感知AI芯片的真實算力。
在體(tǐ)現芯片的真實AI性能(néng)的同時,MAPS評測方法還留有最大的優化空間。這裏的“優化空間”,意思是指即便是一顆芯片出廠以後,它的實際性能(néng)FPS仍有可(kě)能(néng)提升,因為(wèi)算法在往前演進,而随着算法不斷演進,算法的精(jīng)度或者速度也能(néng)夠有所提升。這樣的話,就使得這個芯片的FPS得到持續提升。
随着汽車(chē)電(diàn)子電(diàn)氣架構從分(fēn)布式ECU架構進階到域架構,最終到中央計算機架構,汽車(chē)也将進入全場景整車(chē)智能(néng)時代,智能(néng)汽車(chē)計算架構也将從傳統的編程,用(yòng)邏輯、用(yòng)流程主導的1.0時代走向以神經網絡計算、以數據驅動為(wèi)代表的軟件2.0時代。中央計算架構對整車(chē)計算性能(néng)也提出了更高的要求。
記者:安(ān)全在任何領域都至關重要,如何确保芯片對于信息安(ān)全的支持?衆多(duō)芯片供應商都具備系統化解決方案,并促成汽車(chē)E/E架構的簡化,貴司是否也推出了綜合性方案?
羅恒:傳統汽車(chē)使用(yòng)的分(fēn)布式ECU計算架構需要大約50~150顆MCU,對應的芯片種類也特别多(duō),而且大都是基于成熟工藝的芯片,沒法充分(fēn)利用(yòng)新(xīn)的工藝制程帶來的高階産能(néng)。如果把主機廠所需要管理(lǐ)的所有芯片型号加起來,更是超過1000種,可(kě)以說,不改變汽車(chē)電(diàn)子電(diàn)氣架構(EEA),芯片供應鏈的安(ān)全就很(hěn)難以保證。
從技(jì )術上講,靠增加ECU的數量來提升汽車(chē)的智能(néng),已經難以為(wèi)繼。當前智能(néng)汽車(chē)正在掀起一場電(diàn)子電(diàn)氣架構變革,從分(fēn)布式計算架構往集中式的計算架構演進。當前的演進重點是域控制器架構,但從終局來看,集中式的計算架構打造的是一個高性能(néng)的中央計算平台。
正如生物(wù)的智力進化史一樣,從低等生物(wù)到高等生物(wù),對應的是神經元的持續集中化,并最終進化出了大腦;計算集中化也讓汽車(chē)的智能(néng)得到質(zhì)的提升。
汽車(chē)電(diàn)子電(diàn)氣架構将由分(fēn)布式ECU架構向域架構、中央計算架構發展,而所需要的芯片數量也呈數量級減少。現在這麽多(duō)的小(xiǎo)芯片、上百個MCU,随着電(diàn)子電(diàn)氣架構向中央計算架構發展,最後走向中央計算,汽車(chē)所需要的芯片數量将大大減少,MCU、CPU都可(kě)以整合到高性能(néng)的SoC當中。屆時,整個供應鏈管理(lǐ)要簡單得多(duō),效率也要高得多(duō)。
所以,地平線(xiàn)也提出了一個觀點:芯片缺貨的終極解決之道——計算集中化。
記者:貴司與哪些汽車(chē)品牌展開了合作(zuò)?這些年,主機廠對于搭載芯片的需求是否發生了變化?它們在哪些方面提出了更高的要求?
羅恒:憑借強大、可(kě)靠的技(jì )術實力,地平線(xiàn)目前已同(按照首字母排序)奧迪、比亞迪、長(cháng)安(ān)汽車(chē)、長(cháng)城汽車(chē)、東風汽車(chē)、廣汽集團、紅旗、江汽集團、理(lǐ)想汽車(chē)、奇瑞汽車(chē)、上汽集團等主機廠達成深度合作(zuò),快速搭建開放共赢的智能(néng)汽車(chē)芯生态。
同時,基于征程5,上汽集團、長(cháng)城汽車(chē)、江汽集團、長(cháng)安(ān)汽車(chē)、比亞迪、哪吒汽車(chē)、岚圖汽車(chē)衆多(duō)汽車(chē)廠商已經與地平線(xiàn)達成征程5芯片首發量産合作(zuò)意向,并與理(lǐ)想汽車(chē)達成基于征程5的預研合作(zuò),加快推動高等級自動駕駛功能(néng)的普及上車(chē)。
地平線(xiàn)征程2、征程3芯片在2021年加速實現量産上車(chē),助力車(chē)企實現自動駕駛和車(chē)載智能(néng)交互體(tǐ)驗的升級。截至目前,地平線(xiàn)征程芯片出貨量已突破100萬片,廣泛搭載至多(duō)家主流車(chē)企的明星車(chē)型。
記者:芯片技(jì )術下一步發展方向會在哪裏?遠(yuǎn)矚未來,企業如何面對新(xīn)一輪機遇與挑戰?
羅恒:随着汽車(chē)智能(néng)化的發展,現在對AI計算的需求高漲。汽車(chē)是四個輪子上的計算平台——最大的母生态,會誕生Intel、微軟級别的企業。未來智能(néng)汽車(chē),會像PC時代,不斷升級,形成10年以上周期的發展路徑。
地平線(xiàn)是一家算法基因的公司,與别家企業做AI芯片的最大不同是我們認為(wèi)算法是動态的、不斷變化的,我們随時都在預估未來的趨勢,同時,我們又是一家芯片公司,并不僅僅看算法本身,更看重算法對計算架構的影響。所以基于軟硬結合,我們用(yòng)算法定義芯片并将芯片的性能(néng)發揮到極緻。
當前商業模式,地平線(xiàn)堅持底層賦能(néng),定位Tier 2,以芯片+算法+工具鏈+開發平台為(wèi)核心,開放賦能(néng),支持合作(zuò)夥伴開發有競争力的智能(néng)駕駛解決方案,總結起來就是我們的戰略slogan——AI on Horizon, Journey Together。
AI on Horizon,就是通過底層的人工智能(néng)處理(lǐ)器進行開放的賦能(néng),提供豐富的工具鏈,提供強大的服務(wù),使得我們的客戶、我們的合作(zuò)夥伴能(néng)夠在芯片之上去構建它的産品、構建它的應用(yòng)、提供它的服務(wù)。而貫穿在其中精(jīng)神内涵,就是Journey together,一路成就客戶,因為(wèi)我們相信隻有以成就客戶作(zuò)為(wèi)信仰的企業才能(néng)夠獲得越來越多(duō)的社會的支持,才能(néng)不斷地往前發展。在底層哲學(xué)上,我們深刻地相信,隻有充分(fēn)開放,才能(néng)真正地成就客戶,隻有把我們的AI芯片、工具鏈乃至所有的資源都開放出來,讓我們的客戶不光能(néng)打造無與倫比的産品,而且能(néng)夠實現充分(fēn)的差異化,使他(tā)們在市場上有差異化的競争力。
未來商業模式将進一步開放,餘凱博士在近期的百人會高層論壇的演講中也提出,“讓開放更開放”,地平線(xiàn)将向部分(fēn)整車(chē)廠開放BPU IP授權,推動汽車(chē)芯片産業躍遷。我們幫助車(chē)企自主設計開發芯片,提升差異化競争力,在加快芯片研發速度的同時,大幅降低研發投入。
本篇文(wén)章來源于微信公衆号:汽車(chē)與配件AP