自動駕駛里“規(guī)劃系統(tǒng)”靠什么技術支撐?
在自動駕駛里,規(guī)劃系統(tǒng)相當于在“知道周圍環(huán)境”之后負責做決定的那一部分,類似于人類的“大腦”。感知模塊把攝像頭、雷達、激光雷達等傳感器“看”到的東西變成信息,定位模塊告訴車輛自己在哪里,預測模塊判斷周圍環(huán)境交通參與者的動作可能怎么變化。規(guī)劃要把這些信息綜合起來,回答兩件事,即車要走哪條路以及要以什么樣的速度和姿態(tài)去走。
規(guī)劃不僅要給出如是否變道、是否減速或等待等策略性的動作,也要把策略細化成可以執(zhí)行的軌跡和速度曲線,然后把這些命令交給控制器去執(zhí)行。設計一個好的規(guī)劃系統(tǒng),要在安全、舒適和效率之間找到平衡,同時滿足交通規(guī)則,并能在突發(fā)情況下快速作出可靠反應。
規(guī)劃依賴哪些輸入,以及如何處理不確定性
規(guī)劃系統(tǒng)的工作并不是憑空決定,它高度依賴外界和自身的狀態(tài)信息。定位和地圖提供路網(wǎng)結構、車道信息、限速和路口細節(jié)等語義數(shù)據(jù),這些對復雜路口和長距離行駛非常有幫助。感知負責把周圍車輛、行人和障礙物的位置、速度和朝向等信息傳遞給自動駕駛系統(tǒng),但感知本身并不完美,會有延遲、誤檢或漏檢等風險。面對這種不確定性問題,自動駕駛系統(tǒng)會在輸入端做融合和濾波,讓狀態(tài)估計更穩(wěn)定。預測模塊通常不會只給一個確定性的未來軌跡,而是輸出多個可能性或概率分布,規(guī)劃在使用這些預測結果時會考慮其置信度,把風險高的情形視為需要更保守處理的條件。此外,車輛自身的動力學極限、轉向能力和能量狀況也會約束可執(zhí)行的軌跡,規(guī)劃要保證輸出不僅理論上可行,也能被車輛實際執(zhí)行。
決策與軌跡生成的常見技術路線
規(guī)劃一般分成行為層和運動層兩個層次。行為層負責比較抽象的決策,如是否變道、是否在交叉口給行人讓行或者采取超車策略,運動層把這些決策在考慮車輛動力學約束的前提下轉化為具體的軌跡和速度曲線。
行為層有時使用可解釋性強的規(guī)則或狀態(tài)機來實現(xiàn),這類方法在驗證和合規(guī)上更容易操作,但規(guī)則數(shù)量會隨場景復雜度增長而快速膨脹。近年來,學習方法被用來補充或生成行為候選,尤其是在常見場景中能提高靈活性,但出于可驗證性的考慮,實際使用時常把學習模塊作為建議器,最終決策仍然由可控的優(yōu)化器或規(guī)則層篩選。
運動層的實現(xiàn)手段比較多樣,既有基于搜索的路線規(guī)劃用于全局導航,也有用于局部避障的采樣方法和基于優(yōu)化的連續(xù)軌跡生成方法;趦(yōu)化的方法可以把舒適性、碰撞約束和動力學限制統(tǒng)一建模,通過求解最優(yōu)值來獲得平滑連貫的軌跡。模型預測控制由于能把未來一段時間的受約束運動問題在線求解,常被用于聯(lián)合考慮速度和轉向的聯(lián)合作業(yè),這使得車輛在執(zhí)行規(guī)劃時更接近理想狀態(tài)。在技術落地時,常把幾種方法結合使用,用快速采樣生成候選軌跡,再用較高質量的優(yōu)化器精化選擇,從而在保證實時性的同時提高規(guī)劃的質量。
安全性、魯棒性與與其它模塊的協(xié)同
對于規(guī)劃系統(tǒng)來說,單純把算法堆在一起是遠遠不夠的,真正工業(yè)應用的規(guī)劃系統(tǒng)要把安全性、可驗證性和實時性做成工程級別。規(guī)劃系統(tǒng)常常會采用多層防護,第一層是常規(guī)規(guī)劃輸出;第二層是基于碰撞檢測和安全緩沖區(qū)的在線規(guī)避器;第三層是最低風險動作(Minimal Risk Maneuver),當感知丟失或發(fā)現(xiàn)不可控風險時,車輛能以可控方式停靠或減速到安全狀態(tài)。碰撞檢測通;趲缀文P停ò鼑小A形近似)加時間維度的占據(jù)預測,在線做快速可達性(reachability)分析或保守的安全距離估算。
在魯棒性方面,需要考慮傳感器噪聲、丟幀、地圖差異、天氣影響以及長尾極端場景。可以應對的策略包括把概率論方法(如POMDP)或分布式健壯規(guī)劃引入決策鏈路,使用更保守的成本函數(shù),或在規(guī)劃中顯式考慮預測的不確定性。另外,在線重規(guī)劃和回溯機制是非常有必要的,當環(huán)境發(fā)生變化時,規(guī)劃器需要以很低的延遲重新生成軌跡,并保證切換時的連續(xù)性,避免出現(xiàn)“蹦車”式的激烈動作。
對于自動駕駛汽車來說,實時性是非常重要的參考因素。規(guī)劃通常以幾十毫秒到幾百毫秒的周期運行,具體頻率取決于所處的層級,局部軌跡生成通常在20 ms~100 ms級別循環(huán),行為決策可能在幾百毫秒到秒級。由于計算資源有限,很多系統(tǒng)采用分層架構并做近似以降低在線計算量,比如先用快速的采樣得到候選軌跡,然后在候選集中運行高質量的優(yōu)化器精化最優(yōu)解。此外,仿真和大規(guī)模場景回放也是不可或缺的驗證手段,通過數(shù)百萬公里的仿真來覆蓋長尾工況并對規(guī)劃策略進行打分和改進。
最后的話
規(guī)劃不是孤立的模塊,它需要和預測、感知、控制緊密協(xié)同。預測模塊提供其他道路使用者的未來軌跡分布,規(guī)劃利用這些分布做出既安全又效率高的選擇。感知負責及時發(fā)現(xiàn)障礙并把信息送進規(guī)劃管線,感知的延遲或誤差會直接影響規(guī)劃策略的保守程度?刂破鲃t要能準確執(zhí)行規(guī)劃出來的軌跡,控制的追蹤誤差會反過來被規(guī)劃考慮進約束里(例如規(guī)劃時留出控制誤差邊界)。自動駕駛的規(guī)劃系統(tǒng)是算法、控制理論、概率方法和工程實現(xiàn)細節(jié)的集合體。要做到既安全又舒適并能夠覆蓋現(xiàn)實中的復雜場景,僅靠單一技術是不夠的,需要把多種方法融合起來并通過大量仿真與路測不斷打磨。
-- END --
原文標題 : 自動駕駛里“規(guī)劃系統(tǒng)”靠什么技術支撐?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字