推荐序

2020年初,我应邀在赵刚博士组织的“2020年中国大数据应用年会”上做一个命题演讲,谈了谈对大数据未来发展态势的几个初步判断。我用数据化、数据价值、数据驱动、数据融合、数据经济、数据能力、数据开放、数据未来8个关键词概括了未来的发展态势。严格地说,这不能算是科学系统的研究成果,更谈不上能全面准确地预判大数据的发展态势,顶多反映了个人对几个相关热点话题的关注和思考而已。我没想到赵刚博士是一个有心人,当然也是一个数据强人,他不仅对我的发言做了整理,还建议将我的这个发言作为其大作《数据要素》一书的序言。因此,我有些惶恐,为此不得不再精心梳理一番,以飨读者,希望能有助于大家敲开数据之门。

(1)数据化:所有能数据化的都将被数据化

从狭义上讲,数据化就是将事物及其运动转化为机器可以识别的信息的过程。从广义上讲,数据化是指人类利用数据全面认知并优化改造客观世界的过程。未来,机器会获取越来越多的数据,人类认识和改造世界的能力也会大大增强。

促使这种变化的要素有四个。一是技术。不仅是大数据技术,与数据相关的新一代信息技术,如互联网、移动互联网、物联网、云计算、3D打印、AR/VR/MR、数字孪生、区块链等,都还在不断发酵、进化、孕育、突破,并一起促进大数据的加速发展。人们常说的数据爆炸才刚刚开始。二是需求。大数据用得越多,需求也会越来越多。三是变化。现在已经有大量的大数据改变生产、生活、治理的案例,技术、模式、制度、理念已经出现一些变化,尽管还很初步,但代表了未来的发展方向。四是政策。数据已经被普遍看成新的生产要素,各地都在采取措施依靠大数据为经济发展打造新动能。这四大要素结合起来,将共同推进大数据向前发展,决定了未来大数据发展的趋势。

数据化可以看作未来大数据发展的第一个大趋势——所有能数据化的都将被数据化。无论是生产还是生活,无论是制造业还是服务业,无论是消费端还是产业端,越来越多的东西将会呈现数据化的态势,新一轮的数据大爆炸不可避免。

(2)数据价值:更多的数据价值将被挖掘出来

数据之所以受到重视,是因为数据本身有价值。在美国物理学家约翰·惠勒看来,“万物源于比特”,世界是由比特构成的,也就是由数据构成的。在大数据者的眼里,所有事物都是数据。所以,同样一种物体,他能看到更多的东西:数据从哪里来?到哪里去?它的生态是什么?它会造成哪些影响?你看到的数据越多,说明你的数据能力越强。机器智能发展到今天,我们可以逐步将隐藏在事物内部、背后的数据挖掘出来,捕捉到它们,并把它们储藏起来,开发出针对它们的应用,这就是大数据的价值。

数据价值的核心是发现新规律。当大数据应用到一定程度时,所有规律都可能被发现,无限接近事实本身。例如,一部手机能告诉我们很多秘密:你每天走了多少路,每天睡了几个小时,去过什么地方,你的兴趣爱好,你的消费水平、消费结构、消费习惯,你的财产状况、交友状况,等等。机器会为我们捕捉到更多数据,并从中发现更多规律和事实,这就是大数据的威力所在。

(3)数据驱动:数据驱动一切成为现实

如今,连老司机如果不用导航都不会开车了。我们到一个地方参加会议,基本就是数据驱动:会议通知是数据化的,日程安排是数据化的,出门叫车是数据化的,走什么路线也是数据决定的。使用网约车时,一次叫车的供需匹配技术上只需要0.12秒,但背后要运算数据576亿次。网约车打败出租车、外卖打败方便面、电子商务打败百货商场等表面上看是跨界经营,背后的区别就在于大数据。

现在每个人的手机上都预装、下载有很多App,它们都在你睡觉时悄悄地更新,这样的迭代创新越来越容易,甚至你根本感受不到。移动支付的发展让我们用的钱也都变成了数字,并让我国率先进入了无现金社会。制造业更是如此,原来流水线是把人变成了机器,而将来的智能制造是把机器变得更像人,甚至比人更聪明、更能干、更可靠。

数据驱动一切已经越来越成为现实,大大改变了整个世界。数字已经开始重新定义一切,在你认知的所有事物之前加上“数字”二字,如数字经济、数字政府、数字汽车、数字建筑、数字出行等,你就会发现这些东西已经与以前大不一样了。我们可以发现,用数据说话、靠数据决策、依数据行动已变成非常自然的事情。

数据驱动一切还带来了另一个重大变化或新的机遇:所有生意都值得重做一遍。用数字化的思维看一看你现在所从事的工作、业务,你会发现完全可以重新来过,而且很可能成为绝活。因此,每一家企业都可以问一下自己:10年后,你的竞争对手是谁?

(4)数据融合:催生新业态

这里要强调一个观点:单一数据的价值有限,而多种数据融合的创新潜力无限。

过去,一些政府部门对掌握的数据看得很紧,总能提出很多理由,认为这些数据是不能随便对外开放的。但现在大家已经认识到,如果数据不开放,不让大家使用,它就变得越来越没有价值。现在找到数据的手段、工具、途径比过去丰富多了,远非传统的统计数据可以比拟。不能很好地做到数据开放,就会有新的数据出来,形成覆盖或取代。

数据关联起来融合应用会产生更大的价值。网约车的应用就整合了地理大数据、交通大数据、服务大数据、用户大数据、交易大数据、信用大数据等。近年来出现的诸多新业态、新模式,以及由此而成长起来的独角兽企业,几乎都是多种大数据集成应用的结果。

未来几年,数据融合还会催生一大批数字新物种,成长出一批新的巨无霸平台型、生态型企业。

(5)数据经济:无数据不经济

大家对于数字经济已经耳熟能详,其背后实际上是数据经济,是数据在发挥重要作用。

狭义的数据经济是指以数据的生产、加工、交易为主要对象的经济活动总和,广义的数据经济是指以数据为基础的经济活动的总和。

也许将来所有经济活动都是以数据为基础的,都可以被称为数据经济。所以,我们可以说,“无数据不经济”。

(6)数据能力:未来核心竞争力

未来,谁能够找到大数据,而且用好大数据,这样的企业拥有的竞争力将跟传统企业的竞争力大不一样,其可以轻易完成降维打击。

数据能力体现在哪些方面?这里给出一个简单的公式:

数据能力=数据+算法+算力

数据能力将会成为未来的核心竞争力,形成竞争新优势。对于国家、企业是如此,对于每个人也一样。

我国提升数据能力有自己的独特优势,在未来几年的数据竞争中可以取得一些优势。我们拥有最多的人口和最多的网民,每个人都是最重要的信息源,每个人用的信息越来越多,创造的数据也越来越多,利用数据创造的价值也会越来越大。过去,由于我们的小数据做得不太好,所以对大数据的依赖就会很强,也使大数据得以快速发展。从创新实践看,目前我国在大数据应用领域不比任何一个国家差,我们培养起来的互联网公司有很多都是国际上的佼佼者。

(7)数据开放:政府和企业会主动推进数据开放

这是一个判断,也是一个期待。

从20世纪80年代起,我们逐步建立了各种各样的信息系统,其中最令人头疼的一个问题就是形成了许多“数据孤岛”。这种状况在未来几年将会有大的改观。

大家已经认识到数据价值在什么地方——用的人越用,数据的价值及机构存在的价值越大,创新发展的机遇也越多,反之亦然。

数据开放也是发展大数据产业、催生新业态、培育新动能的迫切需要。对于这个问题,舍恩伯格曾经说得很直白:政府不需要补贴和建立所谓新兴产业,只需要开放自己的数据,就能培育一个新的增长点。也就是说,政府把数据开放出来,它产生的价值是巨大的——数据开放可以让数据流动起来,继而释放价值、整合资源。

对于掌握大量有用数据的企业而言,开放数据也已经成为企业生态化发展的内在需要。开放的数据越多,得到的数据会更多,生态体系会更完善、更强大。

(8)数据未来:“今天才是第一天”

我比较喜欢凯文·凯利的一句话:“今天才是第一天”。他在《必然》一书中提到了影响未来发展的12个驱动力,包括形成、知化、流动、屏读、使用、共享、过滤、重混、互动、追踪、提问、开始,强调一切才刚刚开始,真正伟大的变革还没有出现。这12个驱动力或12个发展趋势,每一个都会对大数据的应用和发展起到促进作用。

在研究数字经济和数字化转型时,我曾提到过8个演进方向和趋势,包括数字化、网络化、数据化、智能化、平台化、生态化、个性化和共享化,这“八化”中的每一个都与大数据应用息息相关。

当然,大数据在发展的同时也会带来一些新的问题。例如,将来数据治理难点和热点都会越来越多,包括数据主权的确认、数据如何进行交易、数据安全和隐私保护、数据跨境流动等,这些都是目前没有研究透,也没有研究好的问题。大数据不是万能的,数据可以让我们发现越来越多的规律,但数据绝不等于事实本身,需要谨防一些数据陷阱。我们在争取用更多的数据、更好的算法发挥作用的同时,要保持清醒的头脑,不能迷信大数据,更不能用大数据干坏事。

基于数据的社会变革才刚刚开始,对于每个数据工作者而言都是任重道远。也许,我们能做的唯一正确的事情就是学习。赵刚博士的新书是关于数据的系统性思考,有助于我们拓展数据的视野。我愿意推荐大家细细品读。

是为序。

张新红

国家信息中心首席信息师