1月10-12日,以“把握形勢 聚焦轉(zhuǎn)型 引領(lǐng)創(chuàng)新”為主題的2020中國電動(dòng)汽車百人會(huì)論壇在北京舉行。
活動(dòng)現(xiàn)場,英偉達(dá)全球副總裁、中國區(qū)總經(jīng)理張建中發(fā)表了演講。

以下為演講全文:
我題目是《自動(dòng)駕駛與機(jī)器人》。為什么講這個(gè)呢?我想今天這個(gè)世界,其實(shí)跟以前不太一樣。英偉達(dá)花了20多年時(shí)間,主要做的工作其實(shí)是叫accelerating computing(加速計(jì)算)。加速計(jì)算跟平時(shí)計(jì)算不一樣的地方是要去達(dá)到所有的計(jì)算速度,讓它用當(dāng)今技術(shù)上能夠達(dá)到的最高水平。我們英偉達(dá)的宗旨就是讓一切的地方能夠讓算力達(dá)到世界上最好的水平。這是我們美國的一棟大樓,我們另外一棟building還沒竣工,我們希望能夠幫助行業(yè)加快發(fā)展。
今天的行業(yè)其實(shí)有一個(gè)最大的變化跟以前不一樣了,大概在去年的時(shí)候很多人都在談IoT(物聯(lián)網(wǎng))比較多,但是我今天想談一個(gè)題目叫SMART EVERYTHING,SMART EVERYTHING跟以前不一樣的地方就是每一個(gè)終端、每一個(gè)設(shè)備基本上智能化的,就像今天很多人都在談?wù)撘稽c(diǎn),包括剛才ADI的同事講電池。所以不光是連接,而且有智能。有智能就得有算法,有算法就得有軟件。其實(shí)整個(gè)智能物聯(lián)網(wǎng)或者叫智能世界最大的變化就是軟件的重新定義,讓所有的設(shè)備都能夠跟設(shè)備之間進(jìn)行互通。
如果我們?nèi)タ从ミ_(dá)的話,我們提供的設(shè)備也是讓這些所有實(shí)現(xiàn)智能連接的方式、方法在不同的場景下實(shí)現(xiàn)。我們有云端的設(shè)備,從CLOUD端做training也好,做測試也好,或者是在終端做計(jì)算。所以說從云端到終端的方案我們都可以提供。我相信對于行業(yè)的消費(fèi)者來講,我們得到的東西遠(yuǎn)遠(yuǎn)比我們看到的東西要多得多。因?yàn)閷τ谙M(fèi)者,他不知道你的計(jì)算是在終端、邊緣還是在云端,但是對于我們來講,如果說提供一個(gè)開發(fā)環(huán)境,讓所有的開發(fā)者去使用他的產(chǎn)品和更好地去開發(fā)他的智能設(shè)備的時(shí)候,我們就要提供一整套的解決方案。其中在機(jī)器人行業(yè),我們給它提供了一個(gè)從端到端的全系列的全棧軟件系統(tǒng)。
我分三個(gè)階段跟大家解釋一下。首先要有一個(gè)端到端的infrastructure,可以用今天的AI開發(fā)方式,給它提供怎么樣做training的Model,training的Model設(shè)備得采集DATA,采集DATA對于機(jī)器人行業(yè)第一個(gè)就要做mapping,因?yàn)樗嚥灰粯樱瑱C(jī)器人在室內(nèi)或者室外移動(dòng)的時(shí)候沒有一條固定的路線,所以基本上任何地方只要有空間都可以跑。但是汽車有一定的規(guī)則,而且還有馬路,所以機(jī)器人相對比較復(fù)雜。你可以給它提供一個(gè)正確的管理方式和方法,這些軟件可以讓任何一個(gè)機(jī)器人在某一個(gè)特定的環(huán)境下面自動(dòng)學(xué)習(xí)。training Model很重要,我相信很多的科研機(jī)構(gòu)跟軟件開發(fā)在這方面研究已經(jīng)很有造詣,大部分的training的模型和方式方法已經(jīng)非常成功。如果我們要想讓它在現(xiàn)實(shí)世界當(dāng)中去驗(yàn)證我們剛才的研究成果好不好,我相信跟王教授談的平行的世界是一個(gè)道理。你要去simulation。simulation基本上是在AI研發(fā)當(dāng)中必不可缺的環(huán)節(jié)。最終就是你的設(shè)備要有一個(gè)移動(dòng)的計(jì)算設(shè)備,這個(gè)計(jì)算設(shè)備的計(jì)算力肯定是越快越好,像馬博士剛才講的算力達(dá)到1000TOPS是指日可待,而且現(xiàn)在就可以實(shí)現(xiàn)了。
我們英偉達(dá)的宗旨,無論哪一個(gè)行業(yè),我們給大家提供的都是一個(gè)OPEN Software Program,這個(gè)OPEN Software Program的架構(gòu)基本上是從一個(gè)SDK開始,SDK CUDA是一個(gè)通用平臺(tái),只要是在CUDA平臺(tái)上開發(fā)的所有軟件都是兼容的,可應(yīng)用在所有的云、邊、端的終端設(shè)備。在這個(gè)平臺(tái)基礎(chǔ)上,我們給大家提供的是所有的不同模塊跟環(huán)節(jié)當(dāng)中和Work flow當(dāng)中所有的SDK,從Sensors、imaging、recorder等等基本上都可以讓機(jī)器人在這個(gè)環(huán)節(jié)當(dāng)中實(shí)現(xiàn)各種各樣的動(dòng)作跟指令。
我給大家演示一下開發(fā)過程,其實(shí)非常簡單,任何一個(gè)研究機(jī)構(gòu)都可以利用我這套端到端的解決方案跟開放的平臺(tái)去實(shí)現(xiàn)機(jī)器人的研發(fā)。如果機(jī)器人研發(fā)當(dāng)中,你不要小看這些小小的設(shè)備,其實(shí)它的應(yīng)用場景跟實(shí)際工業(yè)當(dāng)中的應(yīng)用非常相關(guān),大到礦場、礦山的無人駕駛汽車,完全可以用這樣一個(gè)方法,在實(shí)驗(yàn)室里面幫他去實(shí)現(xiàn)軟件的開發(fā)。我們在這個(gè)過程當(dāng)中也把Isaac開發(fā)平臺(tái)提供給各種各樣的行業(yè)用戶,讓他們在虛擬世界里面去模擬現(xiàn)實(shí)世界當(dāng)中各種各樣的動(dòng)作。今天的深度學(xué)習(xí)已經(jīng)非常發(fā)達(dá),幾乎在每個(gè)領(lǐng)域當(dāng)中都可以用深度學(xué)習(xí)去模擬人的各種各樣的動(dòng)作。在機(jī)器人當(dāng)中有一個(gè)最復(fù)雜的領(lǐng)域,以前傳統(tǒng)用編程的方法給機(jī)器設(shè)計(jì)動(dòng)作,可是這些動(dòng)作怎么做都不可能像人一樣完美。如果我們今天用深度學(xué)習(xí)的方法去應(yīng)用,基本上可以讓機(jī)器人做復(fù)雜到跟人的動(dòng)作一模一樣的動(dòng)作。所以這些成功的研發(fā)也讓我們在機(jī)器人研究當(dāng)中給大家提供了一條新的道路。
我們都知道機(jī)器人應(yīng)用場景非常廣泛,汽車自動(dòng)駕駛就是一個(gè)最大的機(jī)器人。今天你看到的汽車,它的所有動(dòng)作其實(shí)就是機(jī)器人的動(dòng)作,它的感知系統(tǒng)、它的決策系統(tǒng)跟它的計(jì)算系統(tǒng),跟機(jī)器人是沒有什么差別的。既然是這樣的,我們SOFT架構(gòu)跟機(jī)器人的Isaac架構(gòu)也差不多,只不過在英偉達(dá)的DRIVE里面,我們提供了更加復(fù)雜的跟汽車差不多的模塊,其中它的Sensor更復(fù)雜,包括激光雷達(dá)、普通的毫米波雷達(dá)、攝像頭等等。DRIVE這一套SDK跟Isaac的SDK最大的差別是什么?我們要在perception上要去增加它的廣泛性。機(jī)器人通常很少在馬路上跑,但是汽車的應(yīng)用場景不太一樣,在馬路上很多感知的系統(tǒng)非常復(fù)雜,所以說只是在感知系統(tǒng)里面,我們?yōu)镻erception研發(fā)了很多神經(jīng)網(wǎng)絡(luò)就有十幾種,這幾十種神經(jīng)網(wǎng)絡(luò)得到的數(shù)據(jù)、采集數(shù)據(jù)的方式跟處理數(shù)據(jù)的方式都跟機(jī)器人不太一樣,我們把這些在汽車當(dāng)中的各種不同的perception神經(jīng)網(wǎng)絡(luò),把它預(yù)處理,設(shè)計(jì)出很多Model可以給很多開發(fā)者,讓開發(fā)者用自己的數(shù)據(jù)再去強(qiáng)化和增強(qiáng)自己的模塊。
各種不同的Model能做什么,基本上從障礙物的識別、物體的識別,到?jīng)Q策的行為預(yù)測等等,測車跟車之間的距離等等都會(huì)不一樣。另外一個(gè)是在做安全預(yù)測,DRIVE的安全預(yù)測比其他更加重要,因?yàn)槲覀冎榔嚴(yán)碚撋现v,如果按照國家標(biāo)準(zhǔn)的話,任何一輛車要經(jīng)過幾百萬公里的駕駛測試才可以上路,但是今天用DRIVE CONSTELLATION,在super computer上面可以跑幾億公里,可以在自己的云端或者在自己的服務(wù)器上隨意地去測試各種各樣的性能。
這些設(shè)計(jì)好的模型要上到車上去,真正做到自動(dòng)駕駛或者無人駕駛,無論是L4還是L5,其實(shí)算力肯定是遠(yuǎn)遠(yuǎn)不夠。剛才馬博士已經(jīng)幫我透露在CES剛剛發(fā)布的一顆芯片,叫Orin。Orin這顆芯片的算力已經(jīng)達(dá)到200TOPS,但是我們都知道,很多客戶在設(shè)計(jì)他們的自動(dòng)駕駛解決方案的時(shí)候,只是一個(gè)Orin可能還不夠,一定要加上我們的DSCore GPU(音),DSCore GPU就相當(dāng)于今天的特斯拉V100,把V100的獨(dú)立的GPU處理器跟Orin可以布置在一起,這樣去實(shí)現(xiàn)更加強(qiáng)大算力的計(jì)算需要。你自己計(jì)算一下就知道,今天的一個(gè)獨(dú)立的GPU本身就有好幾百個(gè)TOPS,加上200個(gè)TOPS,如果翻兩倍的話,達(dá)到1000個(gè)TOPS是很容易實(shí)現(xiàn)的。
如果用這樣的方法,今天的組合架構(gòu)可以從普通的ADAS,L2、super L2到L4、L5都可以有完整的解決方案,我相信在不同的應(yīng)用場景下面,算力可能要求不太一樣,當(dāng)然,對于每一個(gè)客戶來講,它的成本也不太一樣。如果說能夠在滿足今天的電動(dòng)車在一些高速公路場景上實(shí)現(xiàn)的話,L3跟Super L2可以解決很多自動(dòng)駕駛場景當(dāng)中常見的問題。
讓大家看一下我們最近一段時(shí)間的研究成果。在硅谷,這就是我們剛才說的英偉達(dá)那個(gè)建筑物building,右邊的building還正在建設(shè)當(dāng)中。這條路是從地下車庫出來,從這棟樓要開到另外一棟樓,出門之后要經(jīng)過幾個(gè)街道,這幾個(gè)街道其實(shí)是很麻煩的,你們要是去過硅谷,參觀過我們總部的話,其實(shí)那條路不太好走的。又有人又有車,紅綠燈非常復(fù)雜,我們從車庫出去,全部都是無人駕駛,沒有任何的一次人干預(yù)。經(jīng)過了這些匝道直接上到高速公路,在高速公路上能夠自己變道,像車內(nèi)的AI應(yīng)用也非常復(fù)雜。我們不光是把汽車應(yīng)用在自動(dòng)駕駛當(dāng)中,也應(yīng)用在車內(nèi)的駕駛員的監(jiān)控系統(tǒng),可以看到駕駛員的眼睛注意力不集中的話,他會(huì)提醒這個(gè)汽車和提醒司機(jī)。這個(gè)汽車會(huì)自己自動(dòng)地從主路上變線,或者換到其他高速公路的時(shí)候全部都是自動(dòng)化的,前提是有HD map,在這之前我們已經(jīng)有HD map的service,讓它能夠提供給汽車,讓它自動(dòng)駕駛。你看到這些路況已經(jīng)不只是封閉的高速公路,實(shí)際上它是一個(gè)很開放的、很復(fù)雜的交通環(huán)境。這個(gè)車旁邊有一些故障車或者警車的話,會(huì)自動(dòng)繞開它,找到合適的路線去完成它的駕駛。整個(gè)駕駛環(huán)境,如果大家感興趣,去到英偉達(dá)在美國的辦公室,親自體驗(yàn)一下自動(dòng)駕駛的效果。