不只有结构光:机器眼中的立体世界
要说AI技术里什么最火,机器视觉绝对算一个;而要说机器视觉技术里什么最火,大概毫无争议就属3D机器视觉了。
所谓3D机器视觉,是指在一般的机器视觉技术的基础上,加入对立体空间中三维模型的理解。这项技术不仅涉及AI,而是一门机器视觉、图形学与数据感知技术的交叉学科。想想也知道,让机器认识3D画面是非常有价值的。毕竟人的视觉理解就是3D的,想要让AI尽量贴近真人的感知方式,3D是必须攻克的难题。
在产业场景上,3D机器视觉是无人驾驶和高精地图的重要技术条件,在VR/AR上应用也非常广泛,而无人机航拍与测绘也离不开这门技术。在苹果把3D结构光技术炒火了之后,手机中的3D机器视觉也已经成为兵家必争之地——假如说,这些厉害的技术都是赛车,那么3D机器视觉就是他们在路上都会遇到的收费站……
今天在机器视觉顶会中,差不多会有半壁江山那么多的论文都是跟3D有关。前沿探索可谓疯狂进行。然而重点来了,关于这一领域,似乎大部分吃瓜群众还是只知道一个结构光而已。
有哪些三维图像+机器视觉的新技术趋势,今天正隐藏在未知迷雾中眺望这个世界?今天我们来说几种很有科幻感的技术突破点。说不定这些能力明年就会出现在你的手机、VR设备和无人机中,又或许即将成为某个被资本疯狂亲吻的创业热潮。
超大场景的3D数据感知
3D机器视觉包括很多方面,既有让智能体去理解3D数据,也包括如何通过机器视觉的解决方案,去获取3D模型数据。
传统意义上的3D数据获取,或者称其为3D感知技术,一般来说可以利用多角度拍照或者深度传感器的方式实现3D数据收集。这种技术的局限在于,收集的3D数据不能太大。
然而在3D资料要求不断升级的今天,对于超大场景的3D数据感知,正在成为一个热门议题。比如无人驾驶中使用的城市高精地图,就可以看做一个个超大3D场景的拼接。智能城市领域运用到的很多城市数据推演,也要根植于对城市3D场景的收集。
机器视觉正在为超大场景的3D数据感知提供很多新的方法。比如自动化的成像方法,像视觉SLAM在线处理连续帧的图像,实现实时重建巨大3D场景。再比如说对航拍数据进行点云分割和点云数据的语义理解,帮助快速低成本获取城市3D数据。
总体来看,今天超大场景的3D数据感知,有三个主要应用方向,很可能分别成为各自技术领域中新的投资和创业热点:
1、建筑物的3D高精度模型,运用在工程监理、智能设计、物流和智能城市领域。
2、高精地图与3D数据感知的结合,这是无人驾驶的重要一环。
3、室内外一体的3D建模,这对于智能家居设计、环境监控、VR/AR体验来说都有重要帮助。
手机与3D视觉进入蜜月期
3D结构光,今天已经当之无愧成为了高端手机的标配,成为了继双摄、三摄与屏下指纹之后又一个手机行业争抢的热点。
然而手机上的3D视觉技术远不止于结构光,从算法、传感硬件,到影像系统解决方案,都可能成为手机与3D视觉进一步耦合的关键因素。
今天来看,有3个相关趋势非常可能成为明年的热点。一个是基于芯片端进行的3D视觉算法加速,这很可能成为手机AI的下一个进化方向。第二个是高纠错能力的3D视觉算法将会普及,在终端实现3D数据收集和本地建模将会成为新的热点。第三个是后置摄像头加入3D视觉解决方案指日可待。
从芯片端,到开发平台,再到数据集、传感系统,3D机器视觉正在多个领域影响手机战场的走向,在这些领域储备技术武器,也很可能成为明年手机战场厮杀的关键节点。