行人检测论文笔记:How Far are We from Solving Pedestrian Detection?

文章疑问点

  • Human Baseline 的标准是如何确定的?
  • Ground-truth是什么意思?

    • Groun-truth 指的是正确的标注(真实值)
    • 在有监督学习中,数据是有标注的,以(x, t)的形式出现,其中x是输入数据,t是标注.正确的t标注是ground truth,错误的标记则不是。(也有人将所有标注数据都叫做ground truth)。
  • Intersection over Union(IoU)是什么?

    • Intersection over Union is an evaluation metric used to measure the accuracy of an object detector on a particular dataset.

    • Any algorithm that provides predicted bounding boxes as output can be evaluated using IoU.

    • As long as we have these two sets of bounding boxes we can apply Intersection over Union.

    • An Intersection over Union score > 0.5 is normally considered a “good” prediction.

  • FPPI: False Positive Per Image
  • Oracle Experiment: An oracle experiment is used to compare your actual system to how your system would behave if some component of it always did the right thing.

Read More  

行人检测论文笔记:Ten Years of Pedestrian Detection, What Have We Learned?

Abstract

  • 这种新的决策林探测器在挑战性的Caltech-USA数据集上实现了当前最好的已知性能。

Introduction

  • 更重要的是,这是一个有着已建立的基准和评估指标的良好定义的问题。
  • 用于对象检测的的主要范例有——”Viola&Jones变体“,HOG + SVM模板,可变形部分检测器(DPM)和卷积神经网络(ConvNets)都已经被探索用于此任务。

Read More  

行人检测论文笔记:Pedestrian Detection - An Evaluation of the State of the Art

知识点

  • 对数正态分布(lognormally distributed):对数为正态分布的任意随机变量的概率分布。
    • 如果 X 是正态分布的随机变量,则 exp(X)为对数正态分布.
    • 如果 Y 是对数正态分布,则 ln(Y) 为正态分布。
    • 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。
    • 对数正态分布的概率密度函数为:

  • 对数平均:对数平均与几何平均相等,并且比算数平均,对于对数正态分布数据的典型值更具代表性
    • 二个数字的对数平均小于其算术平均,大于几何平均,若二个数字相等,对数平均会等于算数平均及几何平均。

  • Histogram of Oriented Gradients for Objection Detection.(HOG)步骤:
    • Sampling positive images
    • Sampling negative images
    • Training a Linear SVM
    • Performing hard-negative mining
    • Re-training your Linear SVM using the hard-negative samples
    • Evaluating your classifier on your test dataset, utilizing non-maximum suppression to ignore redundant, overlapping bounding boxes
  • NMS:Non-maximum Suppression(非极大值抑制):可看成一种局部极大值搜索,这里的局部极大值要比他的邻域值都要大。这里的邻域表示有两个参数:维度和n-邻域。
  • LBP: Local Binary Patterns

Read More  

行人检测论文笔记:Pedestrian Detection - A Benchmark

知识点

  • k折交叉验证
  • Non-Maximum Suppression:非极大值抑制算法,非极大值抑制(NMS)可以看做是抑制不是极大值的元素,搜索局部的极大值的搜索问题,NMS是许多计算机视觉算法的部分。
    • 这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。
    • 在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口。

Abstract

  • 引进了一个新的数据集——Caltech。
  • 提出了了个更高的评估标准。
  • 证明了平常用的逐个窗口检测的方法是有瑕疵的,在完整的图片上会预测失败。
  • 衡量了现有的检测系统。
  • 分析了一般的常见失败情况。

Read More