本文提出含有動態空間注意(DSA)的循環神經網絡(RNN)架構來預測行車紀錄影片中的事故(圖一)。我們的DSA-RNN學習了(1)動態地將軟注意(soft-attention)分發到候選物件,以收集微妙的線索,(2)模擬所有提示的時間相依性,以強健性地預測事故。由於事故罕見且可能以許多不同的方式突然發生,預期事故的標註數量要比改變車道,轉彎等預期事件要少得多。為了克服這些挑戰,我們利用最先進的物件偵測[3]來檢測候選物件。其次,在我們的模型中引入全幀和基於物件的外觀和運動特徵。我們還在網上收集了678個行車紀錄事故影片的多樣化數據庫(圖三)。因為所有影片中都記載著各種事故(例如摩托車撞到汽車,汽車撞到另一輛汽車等),是故這個數據庫是獨一無二的。我們手動標記事故的時間位置,並用它們作為監督式學習來訓練和評估我們的方法。我們的方法能在車禍發生大約前兩秒進行預測並擁有80%的召回率(recall rate)和56.14%的精度(precision)。最重要的是,它達到最高的平均精度(74.35%),超過那些沒有注意力或RNN的模型架構。
為了持續優化網站功能與使用者體驗,本網站將Cookies分析技術用於網站營運、分析和個人化服務之目的。
若您繼續瀏覽本網站,即表示您同意本網站使用Cookies。