侵權投訴
訂閱
糾錯
加入自媒體

利用深度學習優(yōu)化視頻結構 助力城市安防

2017-05-19 13:58
來源: C114

深度學習是機器學習中一種基于對數據進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監(jiān)督式或半監(jiān)督式的特征學習和分層特征提取高效算法來替代手工獲取特征。
 
  深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。
 
  視頻結構化助力智慧城市建設

 
  從技術角度來說,智慧城市就是感知、分析和提取城市系統(tǒng)的各種信息并做出相對應反饋的一整套城市管理系統(tǒng),其中,原始的視頻數據是城市系統(tǒng)信息的重要組成部分,F如今,海量視頻數據已成必然,需要一套可以自動從視頻中提取結構化信息的方案,把視頻、圖像“翻譯”成機器可以理解的語言,并進行保存,確保后續(xù)提供給上層應用平臺調用和處理的素材。
 
  視頻結構化的意義
 
  視頻或者圖像數據,從前端傳感器直接獲得,從技術上來說,是一種非結構化信息。只有在實現結構化處理之后,才能將其中有價值的數據直觀、高效的保存、處理和應用。
 
  在智慧城市建設中,有成千上萬路監(jiān)控攝像頭或者傳感器,晝夜不停地監(jiān)視或采集其他原始數據。其中,會產生海量的音視頻數據,需要監(jiān)控管理平臺處理。即便人力充沛的情況下,面對龐大的視頻數據,要求快速、準確地從海量數據中找到有效的信息,幾乎是不可能的。受制于肉眼識別勞動強度的極限,在發(fā)生緊急事件時,人力調配和視頻資源往往存在矛盾,不依靠計算機自動進行篩選,必然造成貽誤戰(zhàn)機。
 
  視頻結構化就是實現將海量視頻中的人、車目標進行提取并識別的過程。一旦有重要事件發(fā)生,系統(tǒng)就可在數據庫中快速查找到關鍵的“人”、“車”、“物”等相關音視頻線索。針對海量監(jiān)控視頻錄像的事后分析,傳統(tǒng)以人海戰(zhàn)術為主的視頻線索查找,顯然不能滿足高效查找,正面臨巨大挑戰(zhàn),急需一種更為高效的、自動的、智能的系統(tǒng)實現上述需求。
 
  深度學習介紹
 
  過去幾年中,得益于高速的計算芯片(GPU)及大量的標注數據,作為當下最流行的機器學習方法,深度學習在各個應用領域中都取得了突破性的成績,未來人們會擁有大量的AI,各種為私人定制的AI,包括醫(yī)療領域,制造業(yè)領域,在商業(yè)方面也會有各式各樣的AI應用產生,包括:營銷,供應鏈,預測及人力資源等,AI會以各種不同的方式出現在我們身邊,例如:機器人,無人機和一些小型機器,AI將使機器更具智能化,使其變得更加安全易用。未來的AI發(fā)展速度將超越摩爾定律。
 
  機器學習是一個級聯串行結構,因此每一環(huán)節(jié)的處理結果都會影響到最后的分類效果,在傳統(tǒng)的機器學習中針對其中的各個環(huán)節(jié)都有其各自獨立的算法。由于上述方法具有各自獨立性,因此傳統(tǒng)機器學習算法在處理問題時需要對各個環(huán)節(jié)進行優(yōu)化,并通過組合優(yōu)化方法在各個模塊中選取最優(yōu)的組合方式。
 
  與傳統(tǒng)機器學習相比深度學習可以把機器學習中的各個部分合成一個整體結構,通過統(tǒng)一的訓練方法(Backpropagation)對其中所有的參數進行調節(jié)。
 
 采用卷積方式與某一卷積核進行卷積所得到的結果,每一結果代表了從原始圖像所提取的特征,通過級聯方式對圖像或信號進行特征提取,最后得到人們想要的分類結果。
 
  結合深度學習技術,實現視頻結構化
 
  在安防行業(yè)中,通過深度學習對視頻進行結構化信息提取,完成了傳統(tǒng)算法無法完成的功能,算法效果也得到大幅度提高。
 
  傳統(tǒng)的CV算法在處理視頻算法時,往往先用檢測或者比較簡單的識別算法,將目標從背景中提取出來。然后,通過識別算法分辨是否是正常目標,最后判斷目標類型。
 
  而利用深度學習技術,可直接通過分類器,將目標從背景中識別出來再進行跟蹤,同時可以直接得到目標類別。這種模式下,目標檢測的準確率和跟蹤的穩(wěn)定性都能夠大幅度提高。
 
  同時,算法不需要根據不同目標類型調用不同模塊進行目標分割或者特征提取,可直接利用目標識別結果,進行特征識別,直接獲得相應的目標屬性。
 
  深度學習技術顛覆傳統(tǒng)算法,輕松完成視頻結構化信息提取。除此之外,結合深度學習本身的技術特色,還對車輛信息提取、人臉識別等已有功能進行改善,效果尤為明顯。
 
  在這之前,人臉識別在傳統(tǒng)算法中,有非常好的效果。在預處理之后,通過提取特定的特征并對特征值進行訓練,最后得到分類器,進行識別。深度學習優(yōu)化了人臉識別的方案,將比較依靠專家選擇的特征提取模塊簡化,通過輸入樣本即可直接訓練得到分類器。
 
  智能交通卡口或者電警攝像頭智能抓拍車輛圖片,并識別車輛號牌字符、車輛顏色、車輛類型等數據。引入深度學習技術之后,車輛的車系信息、年款等信息也被開發(fā)出來,更多的車輛信息被挖掘,為后續(xù)平臺應用提供的更多的數據支撐。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號