物體檢測

物體檢測係一種跟電腦視覺同圖像處理有關嘅計算機技術,用於檢測數字圖像同影片中特定類別嘅語義對象(例如人,建築物或汽車)嘅實例。 [1]精心研究嘅對象檢測領域包括人面檢測同行人檢測。對象檢測喺計算機視覺嘅許多領域都有應用,包括圖像檢索同視頻監視

透過使用喺COCO數據集度訓練嘅YOLOv3模型,使用OpenCV嘅深度神經網絡模塊(dnn)檢測到嘅對象,呢個模型能夠檢測80個常見類別嘅對象。

用途

檢測道路物體

物體檢測廣泛用於電腦視覺任務,例如圖像註釋[2], 行爲識別[3], 人面檢測,人面識別,影片物體佮埋分割。物體檢測亦都用喺跟踪對象,例如喺足球比賽當中跟踪球,跟踪板球拍嘅運動或跟踪視頻入便嘅人。

概念

每個對象類都有自己嘅特徵,有助於對個類進行分類。例如,所有都係圓形嘅。對像類檢測用到啲特徵。例如,搵緊圓嗰陣,搵啲離點(即中心)有特定距離嘅對象。同樣,搵緊正方形嗰陣,需要啲搵邊角垂直邊長又相等嘅對象。類似嘅方法用於人面識別,可以搵對眼、隻鼻同埋嘴唇,又可以搵膚色同眼距等特徵。

方法

喺Microsoft COCO testdev數據集http://mscoco.org度比較各種檢測器嘅速度同準確性[4] (所有值均由這些算法嘅作者喺https://arxiv.org文章中找到)

用於對象檢測嘅方法通常分為基於機械學習嘅方法或基於深度學習嘅方法。對於機器學習方法,有必要首先使以下方法之一定義特徵,然之後使諸如支援向量機(SVM)嘅技術進行分類。另一方面,深度學習技術唔使特定定義好嘅特徵就端到端噉檢測到對象,好多時基於卷積神經網絡(CNN)。

定義特徵抑或劃分區域嘅方法:

  • 機器學習方法:
    • 基於Haar特徵嘅Viola–Jones對象檢測框架
    • 尺度唔變特徵變換(SIFT)
    • 定向梯度直方圖(HOG)特徵[5]
  • 深度學習方法:
    • 區域提議(Region Proposals,用於R-CNN[6], 快速R-CNN[7], 快速R-CNN[8], 級聯R-CNN )
    • 單發MultiBox檢測器(Single Shot MultiBox Detector,SSD) [9]
    • 你衹睇一次(YOLO) [10] [11] [12] [4]
    • 用於目標檢測嘅單發細化神經網絡(RefineDet) [13]
    • Retina-Net[14] [15]
    • 變形得嘅卷積網絡(Deformable convolutional networks)[16] [17]

睇埋

連出去