前言

机器会有智能吗?

什么是人工智能?每个人心中都有自己的答案。

它或许是数学家眼中的机器学习算法,或许是程序员眼中的Java或Python程序代码,或许是能打败围棋世界冠军的AlphaGo,或许是能和人类对话的智能助手Siri、小度与小爱。

它或许是能跑、能跳还会翻跟斗的波士顿机器狗,或许是拥有公民身份的机器人索菲亚,或许是《变形金刚》里的大黄蜂和擎天柱、《终结者》里的杀手机器人T-800、《黑客帝国》里的人类“母体”Matrix。

当我们谈及人工智能时,总是联想到它的各种形态,还有其丰富的应用场景。人工智能给人以希望和幻想,它有着数学的底蕴、文学的色彩、哲学的魅力,它是信息科技的产物,也凝聚着人类的智慧。

那么,一台机器想要拥有“智能”,会面临哪些挑战呢?

首先,机器的智能表现在能够处理那些不太确定的事情上。想象一下,如果让计算机去做数学题,无论它的答案有多准确,我们都不会感到惊讶,因为答案是确定的,计算机只是一个算得很快的计算器。但如果计算机能与人类对话,很自然地回答人类提出的各种带有“不确定性”的问题,它似乎就有点“智能”了。

其次,机器的智能表现在能很好地处理模糊性的知识上。人和计算机处理问题的思维逻辑是不同的,人可以接受很多模糊的定义,计算机却不行。比如要给用户推荐商品,人可以基于主观感受和过往经验直接做出判断,但计算机必须把什么是“用户的喜好”用客观的数学公式定义清楚。还有,人类语言在表达时存在很大的模糊性,比如:一堆沙子至少有几粒?人长多高才不算矮?什么是好看的?悲伤是什么感觉?这些模糊问题的答案,我们很难用语言表达清楚。如果计算机可以很好地处理它们,就又有了一点“智能”了。

最后,机器的智能表现在能处理那些连人类自己都无法梳理清楚的复杂规则上。试想一下,假设你不清楚计算机的运作原理,但通过计算机可以上网搜索资讯,还能通过它和远方的朋友聊天,你会想:“这是怎么实现的?”是的,电子计算机发明至今不到100年,但它的内部构造已经变得相当复杂,足以让人感到神奇。同样,当计算机能成功识别出图像中的一只猫时,你难道不想问一句“这是怎么实现的”?毕竟对我们人类来说,很难把识别猫的规则讲清楚,因为规则太复杂。如果计算机有办法很好地处理图像,它就有了自行理解这些复杂规则的“智能”。

总而言之,机器的智能表现在能处理那些不确定、模糊、复杂的问题上。那么,怎样才能判断机器已经拥有了“智能”呢?答案是,取决于人的主观判断。就是说,机器只要表现得像人一样、看上去有“智能”就行,至于它到底有没有“智能”并不重要。从这点来看,我们人类似乎已经找到了解决方案——基于信息技术、数学算法与大数据。这个方案或许是临时的,但它具有创新性。

当然,任何新技术的发展,不可避免地会影响到现有的技术环境。随着机器开始拥有“智能”,人工智能相关的安全与哲学话题也随之出现。比如:人工智能究竟有没有思想?机器会替代人类吗?人类能否把重要决策交给人工智能?这些问题似乎都在等待着答案。

新闻媒体在报道人工智能时,有时会把一些很小的研究成果描述为足以改变人类文明的伟大成就。这种夸张的报道,虽然十分吸引眼球,但也在一定程度上有意或无意地误导了大众。有些人误以为今天的人工智能已经变得无所不能,但是,如果你真正了解人工智能背后的技术原理和运作逻辑,你就会更加客观地看待人工智能。比起“科幻”,人工智能更是“科学”。

本书特色

本书希望解答一些有关人工智能的通识问题。人工智能本身是一门非常专业、复杂、抽象、跨领域的学科,学习相关专业知识需要投入大量时间和精力。对于一般人来说,重要的不是去搞懂那些专业知识,而是理解人工智能的运作逻辑,这样对每个人的生活和工作更有借鉴意义。

本书尝试用通俗易懂的语言,勾勒人工智能的全貌。换句话说,就是讲明白什么是人工智能。书中会阐述人工智能背后的技术和原理,讨论人工智能在发展过程中遇到过哪些困难,以及它们是如何解决的。本书不是关于人工智能的畅想和漫谈,也不是一本专业的教科书。秉承大道至简的原则,书中不会涉及大量数学公式和程序代码,而是把重点放在讨论人工智能的核心技术和原理上。

如何阅读本书

本书共9章,逻辑上分成三部分,总体结构如下图所示。

人工智能的基础理论部分共3章。

第1章讨论统计学和概率论。人工智能之所以被认为具有“智能”,是因为它从一开始就在想办法处理具有不确定性的问题。随着概率论和统计学等相关理论的发展,科学家们找到了应对这个不确定性世界的有效方法和解题思路。

第2章介绍数据统计的基础知识。我们知道,人工智能是基于数据的,如果数据出了问题,人工智能给出的判断也可能出错。因此,必须更加谨慎地对待基于客观数据的主观结论,避开数据“陷阱”。

第3章讲解信息论。人工智能是一种处理信息的模型。更关键的是,它用信息来消除不确定性。自20世纪以来,以香农为代表的科学家把有关信息的理论发展成一门学科,奠定了信息技术发展的理论基础。运用信息论,人们可以描述信息、度量信息、交换信息,很多有关信息的概念也有了严格的数学证明。

人工智能的核心技术部分共4章。

第4章详细介绍各种针对大数据的处理方法和分析场景。大数据不仅改变了人类过往基于经验的处事方法,也让基于数据的机器学习成为可能。简而言之,大数据赋予了人工智能“智能”。

第5章第6章介绍人工智能的相关算法,即机器学习算法。有了机器学习算法,计算机就能自主学习数据之间的关联关系。这部分的内容较多,我们把它分成两章:第5章围绕传统的基于统计的机器学习算法,第6章围绕基于人工神经网络的深度学习算法。

第7章讨论计算机相关的信息技术。计算是数学的基础,为了应对海量数据处理挑战,人们不断提升计算机的计算速度,使用分布式技术实现并行计算,通过建设数据中心和运用虚拟化技术整合计算资源,并借助开源的方式促进软件编程的大规模协作和技术共享。

人工智能的拓展话题部分共2章。

第8章讨论人工智能安全。我们将重点关注大数据隐私和人工智能安全,比如大数据“杀熟”、隐私计算、深度伪造技术、对抗样本攻击、数据投毒攻击等热门话题和前沿技术,并讨论人工智能的攻防博弈。

第9章展望人工智能的未来。作为全书的收尾,本章会尝试回答以下问题:人工智能会抢走人类的工作吗?机器人会统治人类吗?通用人工智能会出现吗?未来到底会变成什么样子?

勘误和支持

在写作本书的过程中,本人阅读了大量的书籍、专著和论文,并尽可能引用目前比较主流的一些学术观点。因本人才疏学浅,书中内容难免出现错误和疏漏,提出的观点也可能存在局限和不足,希望读者朋友不吝指正。

如果你有任何意见和建议,请与我联系,我的邮箱是xsfree@aliyun.com。

致谢

在撰写本书的过程中,我得到了周围很多同事与朋友的帮助和支持。邱朝阳、陈路亨、胡利斌等人在看过本书部分初稿以后,提出了许多宝贵建议,在此向他们表示感谢。

写书期间,我正在参与有关智能运维国家标准的编制工作,与一大批行业内的人工智能专家、数据科学家、IT专家彻夜研讨是一件愉快的事,我从中获得了不少灵感,也拓展了认知边界。

感谢家人对我的支持,让我能在工作之余安心写书。

感谢机械工业出版社华章公司的高婧雅女士,她不仅帮我整理全书脉络,还给了我很多建议和意见,她的用心让全书的质量有了很大提升。另外要感谢所有参与本书编辑、校对、排版的朋友,没有你们就不会有本书的诞生,在此表示衷心的感谢。

最后,感谢正在阅读本书的你,希望你能从中有所收获,更好地享受智能时代下的美好生活!

徐晟