CV 发展历程
视觉皮层实验 - 1959
- 大脑皮层的神经元对不同的光线方向有选择性响应
- 大脑的视觉处理是层级式的,不同神经元响应不同层次的视觉特征。
特征点提取 - 1963
- 对原始图像进行边缘提取, 特征点选取, 用于后续的图像匹配, 物体检测, 3D 建模
视觉表征分层理论 - 1970s
- 视觉不是一步到位的 3D 理解,而是逐步抽象、逐层处理
- 每一层都是下一层的基础(非常像现代的卷积神经网络层级设计)
部件识别 - 1979
- 视觉任务开始尝试识别更复杂的对象(如人、物体),通过将物体拆解为多个简单部分(Parts),并利用这些部分之间的结构关系进行识别
边缘检测 - 1980s
- 通过边缘检测提取物体的轮廓线条,企图用这些线条来描述和识别物体
分组识别 - 1990s
1980s 边缘检测的方法遇到了严重瓶颈:
- 复杂场景轮廓容易断裂。
- 单纯依靠边缘无法准确分割物体
到了 1990s,视觉领域开始转向利用像素之间的相似性进行分组(Grouping),也就是:
- 将像素划分为多个颜色、纹理相似的区域(即图像分割)
匹配识别 - 2000s
- 重点解决:不同场景、不同视角、不同尺度下,如何找到相同的物体
即使角度、背景、尺度完全不同,依然可以通过局部特征点成功匹配
DL 发展历程
- 感知机 - 1958
- 多层感知机 - 1969
- 新认知机 - 1980
- 反向传播 - 1986
- 卷积网络 - 1998
- 深度学习 - 2006
- 卷积神经网络 - 2012