3D 视觉简介
我们生活在三维空间中,如何智能地感知和探索外部环境一直是一个热门话题。 2D视觉技术借助强大的计算机视觉和深度学习算法取得了超越人类认知的成就,而3D视觉则由于算法建模和环境依赖性等问题始终走在正在进行的研究的最前沿。近年来,3D视觉技术发展迅速,开始与深度学习算法结合,在智能制造、自动驾驶、AR/VR、SLAM、无人机、3D重建、人脸识别等领域取得了优异的成果。
3D 视觉是计算机视觉的终极形式
2D视觉技术主要在二维空间完成工作,三维信息基本没有被利用。只有三维信息才能真实反映物体和环境的状态,更接近人类的感知模式。近年来,学术界和工业界推出了一系列优秀的算法和产品,并在各个领域得到广泛应用。
学术界:CVPR、ECCV、ICCV三大会议每年3D视觉相关主题的文章数量保持在十分之一左右,主要集中在3D点云的识别与分割、单目图像的生成深度图和3D 对象检测。语义SLAM、3D重建、结构光等
行业:3D视觉技术广泛应用于人脸识别、智能机器人、自动驾驶、AR等领域。国内外相关公司相继推出了一系列产品。 OPPO、华为、苹果等公司推出的3D+AI识别功能,可以通过扫描人脸三维结构来解锁手机;在自动驾驶领域,分析3D人脸信息,判断驾驶员驾驶时的情绪状态; SLAM方法重建周围环境。完整的测绘和感知; AR领域通过三维重建技术完成目标的再现。
学习3D视觉技术有哪些难点?
3D视觉是一个广泛的概念,涉及硬件选型、离散数学、非线性优化、最优化理论、矩阵理论、多视几何、空间变换、点云处理、计算机视觉、SLAM、深度学习等。关于知识点对于初学者来说,几乎没有完整清晰的学习路线可以参考。入门和深入都很困难。很多人走了很多弯路,仍然没能取得好的成绩。不过有价值的东西一般都是有难度的,如果你能完全掌握的话,绝对会很有竞争力。
目前关于3D视觉的书籍和论文过于分散。初学者很难掌握关键知识点,无法真正理解一些算法。很多人最终因为门槛高、学习方法不正确而选择放弃、错过。欣赏自己的机会。
3D视觉技术学习路线
基于3D视觉领域缺乏完整的知识路线,我和几个朋友完成了3D视觉技术学习路线的总结,并以思维导图的形式呈现。它主要包括0到16个摘要,每个摘要代表一个特定的区域。知识点。学习路线的总结需要广泛的知识基础。由于我有一定的知识盲点,有不足的地方还望指出。学习路线后续会持续更新维护~