1.2.1 视觉识别

以图像识别和人脸识别为代表的感知技术已经走向了应用市场,特别是在交通、医疗、工业、农业、金融、商业等领域,带动了一批新业态、新模式、新产品的突破式发展,带来了深刻的产业变革。苹果公司的iPhone手机包含Face ID、A13芯片等AI技术。苹果的Face ID技术有人脸验证功能。iPhone的顶部集成了实现Face ID功能的器件,包括红外镜头、泛光感应元件、点阵投影器和普通摄像头。从原理上讲,当红外摄像头发现一张面孔时,点阵投影器会闪射出3万个光点,接着红外摄像头会捕捉这些光点的反馈,从而采集一张人脸的3D数据模型,并与A13芯片中存储的模型进行比对。如果互相匹配,就可以解锁了,iPhone随即被唤醒。为了更加精确地进行人脸识别,苹果芯片中包含了一个神经引擎,用神经网络处理图像和点阵模式,并邀请好莱坞特效面具公司制作面具来训练神经网络,以保证安全性。The Verge(美国科技媒体网站)曾借用了一台具有夜视功能的摄像机,成功拍摄到这些肉眼不可见的红外光点,可以看到这3万个光点非常密集,不只是投射至人脸,连衣服上也有,视觉效果极其震撼。

如图1-5所示,在大规模视觉识别挑战赛(LSVRC)比赛中,图像标签的错误率从2010年的28.5%下降到了2.5%,AI系统对物体识别的性能已经超越了人类。在国内,视觉与图像领域的融资排在第一,在整个AI投资中占比23%(数据来源:腾讯的《中美两国人工智能产业发展报告》),说明国内投资者非常看好这一领域。

图1-5 物体识别能力比较(直线为人类,曲线为AI)