自動(dòng)駕駛汽車(chē)的端到端學(xué)習(xí)
研究人員將使用udacity提供的模擬器,模擬車(chē)前部配有3個(gè)攝像頭,可記錄視頻以及與中央攝像頭對(duì)應(yīng)的轉(zhuǎn)向角。
行為克隆的本質(zhì)是克隆了驅(qū)動(dòng)程序的行為。本文的實(shí)驗(yàn)思路是根據(jù)駕駛員駕駛的訓(xùn)練數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)以模擬駕駛員。
NVIDIA曾發(fā)布了一篇題為End to End Learning for Self-DrivingCars 的文章,他們訓(xùn)練CNN將原始像素從單個(gè)前置攝像頭直接映射到轉(zhuǎn)向命令。實(shí)驗(yàn)結(jié)果令人非常震驚,汽車(chē)學(xué)會(huì)了在有或沒(méi)有車(chē)道標(biāo)記的地方道路上或者在具有最少量訓(xùn)練數(shù)據(jù)的高速公路上行駛。本次實(shí)驗(yàn),研究人員將使用udacity提供的模擬器,模擬車(chē)前部配有3個(gè)攝像頭,可記錄視頻以及與中央攝像頭對(duì)應(yīng)的轉(zhuǎn)向角。
收集數(shù)據(jù)
模擬器有2個(gè)通道:第一個(gè)通道非常容易,曲線較小且很少,第二個(gè)通道很難,有許多曲線和陡峭的山坡。
研究人員將使用來(lái)自兩個(gè)軌道的訓(xùn)練數(shù)據(jù):
1.研究人員將駕駛兩條車(chē)道,將車(chē)保持在車(chē)道的中心位置。研究人員每人開(kāi)車(chē)2圈。
2.研究人員將在兩條車(chē)道上各開(kāi)一圈,并試圖漂移到兩側(cè),或試圖轉(zhuǎn)向車(chē)道的中心。這將為研究人員提供模型校正的訓(xùn)練數(shù)據(jù)。
圖分別為左、中、右視角
捕獲的數(shù)據(jù)包含左圖像,中心圖像和右圖像的路徑,轉(zhuǎn)向角度,油門(mén),中斷和速度值。
注意:研究人員將使用所有左,中,右圖像。研究人員將通過(guò)一些調(diào)整來(lái)矯正left_image的轉(zhuǎn)向角度。同樣,研究人員將通過(guò)一些調(diào)整來(lái)矯正right_image的轉(zhuǎn)向角度。
數(shù)據(jù)不平衡
轉(zhuǎn)向角直方圖
上面的直方圖顯示了訓(xùn)練數(shù)據(jù)的不平衡。左轉(zhuǎn)彎的數(shù)據(jù)多于右轉(zhuǎn)彎的數(shù)據(jù)。研究人員將通過(guò)隨機(jī)翻轉(zhuǎn)訓(xùn)練圖像并將轉(zhuǎn)向角度調(diào)整為steering_angle來(lái)補(bǔ)償這一點(diǎn)。
此外,大多數(shù)轉(zhuǎn)向角集中在0-0.25左右,研究人員沒(méi)有太多的數(shù)據(jù)來(lái)獲得更大的轉(zhuǎn)向角。研究人員將通過(guò)一些像素水平和垂直地隨機(jī)移動(dòng)圖像并相應(yīng)地調(diào)整轉(zhuǎn)向角來(lái)補(bǔ)償這一點(diǎn)。
數(shù)據(jù)擴(kuò)充
研究人員使用以下增補(bǔ):
1.隨機(jī)翻轉(zhuǎn)一些圖像并將轉(zhuǎn)向角度調(diào)整為steering_angle
2.通過(guò)一些像素水平和垂直地隨機(jī)移動(dòng)圖像,并使用小的調(diào)整因子調(diào)整轉(zhuǎn)向角度。
3.路上有樹(shù)木,柱子等陰影。因此,研究人員將為訓(xùn)練圖像添加一些陰影。4.研究人員會(huì)隨機(jī)調(diào)整圖像的亮度。
以上這些是標(biāo)準(zhǔn)的OpenCV調(diào)整,代碼可以在GitHub存儲(chǔ)庫(kù)中找到。(詳見(jiàn)文末鏈接)
應(yīng)用增強(qiáng)后,下面是一些訓(xùn)練圖像的輸出。
前處理
本文期望圖像的輸入尺寸為66 * 200 * 3,而來(lái)自訓(xùn)練的圖像尺寸為160 * 320 * 3。此外,紙張期望將輸入圖像從RGB轉(zhuǎn)換為YUV顏色空間。因此,研究人員將從輸入圖像裁剪上部40像素行和下部20像素行。此外,作為預(yù)處理的一部分,研究人員將裁剪的圖像大小調(diào)整為66 * 200 * 3大小并將其轉(zhuǎn)換為YUV色彩空間。
模型
這是本文中描述的PilotNet模型:
該模型具有以下層:
①標(biāo)準(zhǔn)化層(硬編碼)除以127.5并減去1。
②3個(gè)卷積層,24個(gè),36個(gè),48個(gè)過(guò)濾器,5 * 5內(nèi)核和2個(gè)步幅。
③2個(gè)卷積層,64個(gè)濾波器,3 * 3內(nèi)核和步幅1。
④展平層
⑤3個(gè)完全連接的層,輸出尺寸為100,50,10
⑥和輸出轉(zhuǎn)向角的最終輸出層。
研究人員將使用Mean Squared Error(MSE)作為損失函數(shù)和優(yōu)化器,并進(jìn)行EarlyStopping回調(diào)。研究人員試圖訓(xùn)練它40個(gè)epoch,它在36個(gè)epoch停止。
訓(xùn)練60個(gè)epoch的模型,結(jié)果如下:
突出的特點(diǎn):
1. 在每個(gè)圖層中,對(duì)要素圖的激活進(jìn)行平均。
2.最平均的地圖按比例放大到下面圖層的地圖大小。使用反卷積完成放大。
3.然后將來(lái)自較高級(jí)別的放大的地圖與來(lái)自下層的平均地圖相乘。
4.重復(fù)步驟2和3直到達(dá)到輸入。
5.具有輸入圖像大小的最后一個(gè)掩模被標(biāo)準(zhǔn)化為0.0到1.0的范圍。
以下是可視化圖,顯示輸入圖像的哪些區(qū)域?qū)W(wǎng)絡(luò)的輸出貢獻(xiàn)最大。
在應(yīng)用上述方法之后,下面是顯著的特征結(jié)果:
圖突出的車(chē)道標(biāo)記
結(jié)論
PilotNet是一個(gè)非常強(qiáng)大的網(wǎng)絡(luò),從駕駛員學(xué)習(xí)輸出正確的轉(zhuǎn)向角度。對(duì)顯著物體的檢查表明,PilotNet學(xué)習(xí)了對(duì)人類“有意義”的特征,同時(shí)忽略了與駕駛無(wú)關(guān)的攝像機(jī)圖像中的結(jié)構(gòu)。此功能源自數(shù)據(jù),無(wú)需手工標(biāo)記。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測(cè)試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
- 1 從技術(shù)狂歡到安全合規(guī) :2025上半年自動(dòng)駕駛?cè)谫Y進(jìn)入“場(chǎng)景閉環(huán)”新周期
- 2 最嚴(yán)輔助駕駛新規(guī),兩部門(mén)再劃監(jiān)管、宣傳紅線
- 3 智駕技術(shù)戰(zhàn):特斯拉、華為、理想、小鵬和比亞迪,誰(shuí)才是未來(lái)?
- 4 百度蘿卜快跑:從北大嶼山到香港島:自動(dòng)駕駛在香港的 “三級(jí)跳” 啟示錄
- 5 ADS 4推送在即,華為乾崑憑什么率先奪下L3的“橋頭堡”?
- 6 自動(dòng)駕駛RoboTaxi“闖五關(guān)”:混合運(yùn)營(yíng)才能扛起商業(yè)化大旗?蘿卜快跑、小馬智行、文遠(yuǎn)知行、特斯拉、Waymo怎么選?
- 7 狂飆 836%!小馬智行與文遠(yuǎn)知行,自動(dòng)駕駛界的 “瑜亮之爭(zhēng)”,誰(shuí)能成為王者?
- 8 自動(dòng)駕駛專利大揭秘:中國(guó)憑啥占了全球超四成?百度公司3477件申請(qǐng)量霸氣登頂榜首
- 9 尚界新車(chē)16.98萬(wàn)起!鴻蒙智行“四界”齊發(fā),第二階段拼什么?
- 10 輔助駕駛出海、具身智能落地,稀缺的3D數(shù)據(jù)從哪里來(lái)?