鳳凰網(wǎng)科技訊(作者/李治欽)7月5日,理想汽車召開智能駕駛夏季發(fā)布會,正式發(fā)布OTA 6.0,將提供無圖NOA能力。該版本將在7月內(nèi)全量推送給理想MEGA和理想L9、理想L8、理想L7、理想L6的AD Max車型。
理想汽車表示,新版本的無圖NOA具備四大能力,包括可在無圖無先驗(yàn)情況下的“哪里都能開”,在規(guī)避路側(cè)障礙時(shí)“繞行絲滑”,在應(yīng)對各類路口時(shí)更加流暢的“路口輕松”,以及對車輛進(jìn)行微操調(diào)整的“默契安心”。
同時(shí)理想汽車還強(qiáng)調(diào)了主動(dòng)安全的四大能力,集中在AEB(自動(dòng)緊急剎車)和AES(自動(dòng)緊急避讓)兩大方面,包括復(fù)雜路口AEB、夜間弱光AEB、全自動(dòng)AES和全方位低速AEB。
發(fā)布會還介紹了理想汽車在自動(dòng)駕駛模型方面的開發(fā)歷程及進(jìn)展,并發(fā)布了新的端到端+VLM自動(dòng)駕駛技術(shù)架構(gòu)。
理想汽車表示:其自動(dòng)駕駛系統(tǒng)具備快速決策的系統(tǒng)1和具備思維推理能力的系統(tǒng)2。
系統(tǒng)1第一代:NPN采用模塊化的設(shè)計(jì),包含感知、定位、規(guī)劃、導(dǎo)航、NPN等,實(shí)現(xiàn)了全國100城NOA功能。第二代可實(shí)現(xiàn)無圖智駕,不依賴先驗(yàn)信息。第三代將采用端到端模型,只有一個(gè)模型,實(shí)現(xiàn)輸入的是傳感器,輸出的是行駛軌跡。
理想汽車表示:第三代端到端模型的優(yōu)勢,在于駕駛體驗(yàn)更聰明更膩人、車輛反應(yīng)更迅速及時(shí)、迭代頻率更高,OTA速度加快。
系統(tǒng)2:VLM(視覺語言模型)。整體算法架構(gòu)是由一個(gè)統(tǒng)一的Transformer模型組成,將Prompt(提示詞)文本進(jìn)行Tokenizer(分詞器)編碼,然后將前視120度和30度相機(jī)的圖像以及導(dǎo)航地圖信息進(jìn)行視覺信息編碼,通過圖文對齊模塊進(jìn)行模態(tài)對齊,統(tǒng)一交給VLM模型進(jìn)行自回歸推理;VLM輸出的信息包括對環(huán)境的理解、駕駛決策和駕駛軌跡,并傳遞給系統(tǒng)1控制車輛。
理想汽車稱,系統(tǒng)2整體設(shè)計(jì)中有三個(gè)亮點(diǎn):
1、設(shè)計(jì)了流式的視頻編碼器。相比大部分單幀的VLM模型,我們采用的流式視頻編碼器能夠緩存更長時(shí)序的視覺信息,這對于物理世界的AI系統(tǒng)來說非常重要。
2、增加了Memory bank(記憶模塊),緩存了多幀歷史信息,可以解決超長上下文的推理時(shí)延問題。
3、設(shè)計(jì)了智能駕駛Prompt問題庫。系統(tǒng)2會時(shí)時(shí)刻刻思考當(dāng)前的駕駛環(huán)境,給系統(tǒng)1合理的駕駛建議,同時(shí)系統(tǒng)1也可以在不同場景下調(diào)用不同的Prompt問題,主動(dòng)向系統(tǒng)2進(jìn)行求助,幫助系統(tǒng)1解決部分場景。
最后,理想汽車表示,除推送具備無圖智駕能力的OTA6.0以外,還將開始端到端+VLM新智能駕駛系統(tǒng)的早鳥計(jì)劃。