计算机视觉作为一种人工智能的基础技术应用,使用场景多样,市场潜力巨大。而计算机视觉又与传感器密切相关,只有经过传感器对环境信息的采集,才能进而实现数据的存储、处理以及后续的推理判断与执行。近日,意法半导体(ST)举办线上媒体沟通会,与会嘉宾在对人工智能时代传感器的技术发展与市场应用进行介绍时指出,计算机视觉将加速全局快门传感器的应用。

计算机视觉应用于四大场景

计算机视觉是人工智能领域的一个重要分支,其可以让计算机等智能设备从图像、视频以及其他视觉输入的数据库中提取有意义的信息,并对这些数据进行处理,进而采取行动。目前,计算机视觉在生产生活当中已有了很多实际应用,比如智能手机中的面部识别技术就已经被广泛应用于屏幕解锁和电子支付等方面。

根据意法半导体亚太区影像事业部技术市场经理林国志的介绍,计算机视觉的应用场景大致可以归纳为四大类:首先是深度感应,主要用于面容识别、3D扫描等场景。这类应用场景大致通过两个全局快门传感器搭建一组双目摄像头系统,或者使用一个全局快门传感器搭建结构光摄像头系统。

其次是生物识别,主要是采集人体各个部位的信息并用于身份识别,除人脸识别之外,还包括手势检测、指纹识别、虹膜识别等。

再次是增强现实、虚拟现实和混合现实等应用场景,包括6DoF(六个自由度追踪)和SLAM(同步定位与地图构建)。6DoF主要针对头部行为,当用户戴上VR头显设备后就会得到6D感知能力,头部可以做出左右、上下、前后六个角度的动作。当用户需要掌握自己所处房间状况时,则可以通过SLAM发挥作用。此外,使用VR/AR设备还可以进行生物识别,比如手势检测或者手势追踪。在这种场景下,设备可以通过用户的一个手势,识别出该行为的目的,比如用户在做一场演讲时,通过一个手势就可以自动翻到下一页或者翻回到首页,或者通过手势实现鼠标的单击和双击。

最后一类应用场景是机器人与工业控制,如无人机和扫地机器人等。这些设备在使用过程中要避免相互碰撞,就需要具有物体检测和场景分析能力。而在这些应用场景中,传感器都可以发挥关键作用。

全局快门与卷帘快门各具优势

由于计算机视觉的应用场景与一般用途的摄像头不同,并不注重静态图像的捕捉与色彩渲染,因此智能手机与监控摄像头等设备中日常搭配使用的卷帘快门传感器并不适用。林国志介绍,从拍摄角度划分,图像传感器可以分为全局快门与卷帘快门两大类型。

人们日常接触的多数摄像头,大都采用卷帘快门传感器,比如智能手机的主摄像头和自拍摄像头,楼宇中安装的监控摄像头以及数码相机中大都采用卷帘快门技术。因为这些应用场景都需要捕捉彩色图像,需要相当高的分辨率。卷帘快门的设计目的正是为了捕捉静态图像和视频拍摄,需要非常高的分辨率和颜色处理能力。

问题在于,计算机视觉当中采用卷帘快门传感器都是逐行拍摄图像的,整个图像只有一帧。如果拍摄对象是车辆这样的快速移动物体,图像就有可能发生扭曲,无法显示拍摄对象原始形态,使得机器无法判断不同图像中的车辆是不是同一辆车,也就无法用于计算机视觉的处理。

全局快门的原理则不同,其拍摄时间非常短,只要拍摄对象不是快速移动的物体,成像效果就非常准确,因此更加适用于计算机视觉。随着计算机视觉在人工智能领域的应用快速铺开,也将促进全局快门传感器的发展。

意法半导体亚太区影像事业部技术市场高级经理张程怡表示,目前全局快门传感器在消费性电子和汽车领域的应用势头非常猛。消费性电子上应用最典型的就是人脸识别,无论智能门锁、门禁管制,还是电子支付都已开始采用。汽车领域的主要应用场景是驾驶者的监控和对乘客监控。此外,全局快门传感器在机器人、绘制地图、AR/VR等领域的发展势头也不错。

在谈到全球快门是不是会全面取代卷帘快门传感器时,张程怡认为,两者各有优势。在拍摄静态照片或视频时卷帘快门的像素更小、解析度更高,在用于手机主摄像头等设备中更具优势,但全局快门在计算机视觉这类识别动态影象方面更有优势。卷帘快门的画点大概在1.1微米以下,而全局快门通常在2.2微米以上,单仅画点尺寸上,两者就代表了不同的应用领域。基于此,也可看出全局快门传感器的技术发展趋势像素尺寸持续缩小,画点持续变多,功耗优化。

目前,意法半导体消费和工业用全局快门图像传感器已推出VD55G0 40万像素和VD56G3 150万像素两款产品。这些产品在940nm处具有最高的量子效率,拍摄性能稳健;正方形传感器的分辨率与镜头最佳匹配,适合旋转拍摄使用场景;拍摄时间很短,降低系统功耗,能够在确保准确成像的同时降低系统功耗。

(文章来源:中国电子报)

推荐内容