使用相機(jī)和深度學(xué)習(xí)制作偽LiDAR
1.監(jiān)督深度估計(jì)
“監(jiān)督”深度學(xué)習(xí)背后的概念很簡單,收集RGB圖像及其相應(yīng)的深度圖,訓(xùn)練類似于“自動(dòng)編碼器”的體系結(jié)構(gòu)進(jìn)行深度估計(jì)。(盡管訓(xùn)練起來不那么簡單,但如果不通過訓(xùn)練過程整合一些特殊技巧,FCN就永遠(yuǎn)無法真正發(fā)揮作用:)。
盡管此方法更易于掌握,但在現(xiàn)實(shí)生活中收集深度圖是一項(xiàng)昂貴的任務(wù)。LiDAR數(shù)據(jù)可用于訓(xùn)練這類網(wǎng)絡(luò),因此,如果我們對由LiDAR收集的數(shù)據(jù)進(jìn)行訓(xùn)練,則神經(jīng)網(wǎng)絡(luò)的性能將明顯優(yōu)于LiDAR,但仍然可以,因?yàn)槲覀儾恍枰欠N級別的準(zhǔn)確性來駕駛汽車例如,知道樹上是否有葉子的確切距離。
2.無監(jiān)督深度估計(jì)
僅在一系列環(huán)境中記錄質(zhì)量深度數(shù)據(jù)是一個(gè)具有挑戰(zhàn)性的問題。無監(jiān)督方法可以在沒有地面真實(shí)深度圖的情況下學(xué)習(xí)深度!
“這種方法只是查看未標(biāo)記的視頻,并找到一種方法來創(chuàng)建深度圖,方法不是嘗試正確,而是嘗試保持一致!
3.神經(jīng)網(wǎng)絡(luò)架構(gòu)
該網(wǎng)絡(luò)具有類似于U-Net的架構(gòu),編碼器部分是在ImageNet數(shù)據(jù)集上訓(xùn)練的預(yù)訓(xùn)練DenseNet模型。解碼器部分使用雙線性上采樣而不是簡單的上采樣。
簡而言之,我們使用雙線性上采樣是因?yàn)樗谏喜蓸雍髸?huì)整體上產(chǎn)生“平滑”圖像。輸出是深度圖,深度圖是圖像大小的一半,這有助于網(wǎng)絡(luò)學(xué)習(xí)更快。
4.圖像增強(qiáng)
對于圖像增強(qiáng),可以使用以下技術(shù):圖像翻轉(zhuǎn),輸入圖像的色彩通道改組,向輸入圖像添加噪點(diǎn),增加輸入圖像的對比度,亮度,溫度等。這樣可以確保模型在整個(gè)訓(xùn)練過程中始終看到新數(shù)據(jù),并更好地泛化未見數(shù)據(jù)。
目前,深度估計(jì)在AR / VR中已經(jīng)得到了許多應(yīng)用。
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
推薦專題
- 1 從技術(shù)狂歡到安全合規(guī) :2025上半年自動(dòng)駕駛?cè)谫Y進(jìn)入“場景閉環(huán)”新周期
- 2 智駕技術(shù)戰(zhàn):特斯拉、華為、理想、小鵬和比亞迪,誰才是未來?
- 3 最嚴(yán)輔助駕駛新規(guī),兩部門再劃監(jiān)管、宣傳紅線
- 4 自動(dòng)駕駛RoboTaxi“闖五關(guān)”:混合運(yùn)營才能扛起商業(yè)化大旗?蘿卜快跑、小馬智行、文遠(yuǎn)知行、特斯拉、Waymo怎么選?
- 5 百度蘿卜快跑:從北大嶼山到香港島:自動(dòng)駕駛在香港的 “三級跳” 啟示錄
- 6 ADS 4推送在即,華為乾崑憑什么率先奪下L3的“橋頭堡”?
- 7 “紅!笔袌鲆廊挥行隆盎印保2025成都車展重磅SUV全面看
- 8 OTA,不能再亂更新了
- 9 自動(dòng)駕駛專利大揭秘:中國憑啥占了全球超四成?百度公司3477件申請量霸氣登頂榜首
- 10 尚界新車16.98萬起!鴻蒙智行“四界”齊發(fā),第二階段拼什么?