- 人工智能:人脸识别与搜索
- 张重生
- 1697字
- 2021-03-31 21:20:22
前言
人脸识别、语音识别、无人驾驶是人工智能众多研究分支中的“显学”,在生活中为广大群众所熟知,也最容易被理解和接受。相对人工智能其他分支的抽象和晦涩,人脸识别这一分支更为直观,而且落地应用众多。如今,我们已处于“刷脸”时代,越来越多的“刷脸”应用开始出现,如已经普及的火车站“人票证”合一式的刷脸验票,厦门、杭州部分景区的刷脸入园,支付宝的金融支付,刷脸签到等广为人知的应用。
“广义”的人脸识别,在技术上可细分为人脸检测、人脸识别、人脸检索、人脸关键点定位、人脸表情识别、人脸生成等技术。人脸识别技术的发展大致可分为四个时期:EigenFace 方法时期、Gabor-LBP 方法时期、基于稀疏表示的人脸识别方法时期和基于深度学习的人脸识别方法时期。每个时期都有代表性的人脸识别算法和技术,并在技术上取得了一定突破。其中,2012年以后,尤其是2014年至今,基于深度学习的人脸识别方法取得了高水平的人脸识别性能,因此得到了学术界和工业界的高度重视,并投入大量的科研力量。
笔者之前出版的《刷脸背后:人脸检测 人脸识别 人脸检索》一书,得到了广大读者的青睐,成为人脸识别领域较为畅销的书籍之一。该书出版后,收到了很多读者的信息和咨询,其中包括很多媒体朋友,如《新京报》《Vista 看天下》杂志等。2019年热播的电视剧《亲爱的,热爱的》亦将本书选作女主角在剧中阅读的高科技书籍,对此,电子工业出版社在自媒体上进行了宣传。由此可见,人脸识别已经为广大读者和媒体所广泛关注。《刷脸背后:人脸检测 人脸识别 人脸检索》成书于2016年之前,而人脸识别在2016年之后取得了更大的突破和进展,发展更为迅猛,涌现出很多新方法和新技术,包括人脸检测、人脸识别、人脸关键点定位、人脸图像生成等方面的最新技术。因此,十分有必要对这些最新的基于深度学习的人脸识别方法进行系统讲解和阐述。
受电子工业出版社邀请,笔者于2019年开始了本书的撰写工作。新书的特点是:深度方法和经典方法并重,理论讲解和应用实践兼修。新书在高度关注最新最前沿的人脸识别技术的同时,仍然重视经典的(传统的)人脸识别方法和技术的讲解和实践,这些经典方法在今天的应用中仍然有很多用武之地和借鉴之处。
本书共13章。第1章为人脸识别概述;第2~5章及第13章属于人脸识别最新技术篇,分别从技术角度讲解了人脸检测、人脸识别、人脸关键点定位、人脸检索、人脸图像生成的最新技术;第6~12章属于人脸识别实践篇,从实战角度讲解了人脸检测、人脸识别、人脸关键点定位和人脸检索的技术和实践案例。
本书主著为张重生,研究生曹爽主要负责第13章的工作,她和研究生刘大征的贡献各占约50%。
笔者在撰写此书的过程中,查阅了一些学术论文和技术资料。据笔者了解,现在的人脸识别专业书籍非常匮乏,尤其是有理论深度并能反映最前沿的人脸识别技术的书籍更为稀缺。究其原因,是人脸识别这一人工智能“显学”具有巨大应用市场和商业价值,很多核心技术或关键细节掌握在少数公司手中。据了解,目前人脸识别公司普遍采用了基于深度学习的人脸识别技术。一本最权威、最深入的人脸识别书籍如果由国内的商汤、旷视、中科视拓、依图、腾讯优图,以及美国的谷歌、脸谱,立陶宛的NEURO Technology 等公司专门从事人脸识别核心研发的技术总监联袂撰写,并公开算法、应用内幕及相关的技术细节等资料,将对人脸识别理论和技术的传播、专业人才的培养带来巨大的推动作用。然而,这样的书籍可遇而不可求,因为写书是一个时间和精力投入巨大而所获经济效益很小的工作,这些公司忙于新产品的研发和市场的开拓,无暇出版这样的人脸识别书籍。
纸上得来终觉浅,绝知此事要躬行。本书只为抛砖引玉,为读者系统介绍人脸识别的相关理论和技术,尤其是最前沿的人脸识别技术,为读者学习、了解人脸识别提供较为全面的线索和参考资料。读者如果要深入了解某个人脸识别算法,则应仔细学习并理解原版的英文论文,调试相关的源代码并使用主流的人脸数据集进行大规模实验验证;同时,要注重对算法细节的把握,因为很多算法成功的关键在于细节的考究和精细化处理。
科学研究必须实事求是,写书亦如此,书中纰漏之处恳请读者批评指正,也非常欢迎对人脸识别感兴趣的读者与笔者联系交流。笔者电子邮箱为chongsheng.zhang@yahoo.com,微信号为A13938613173。