1.2.3 科技进步带来的新问题

经济学上有一个术语叫作价格歧视,意思是同样的服务和产品,以不同的价格卖给不同的用户,以实现商业公司利润最大化的目标。通常情况下一个商家要实现价格歧视,需要有三个条件:第一,商家有能力了解每个消费者的购买意愿和能力,可以对每个人进行单独定价;第二,消费者对商品或服务的价格并不敏感,也无处得知该商品或服务的定价标准;第三,消费者之间是彼此独立的,一般情况下不会互通价格。

同时满足以上三个条件的情况比较少,如今的线下零售行业几乎是明码标价的,所有人看到的都是一样的价格标签。但是互联网行业不同,它可以通过大数据分析用户的消费行为,判断其是否是价格不敏感的用户。这样,互联网商户很容易就可以满足前两个条件,拥有所谓的“上帝视角”。另外,每个人的手机或计算机屏幕是分隔的,除非你刚好有个朋友也在浏览相关商品或服务,否则几乎无法判定这个价格是统一的标准价格,还是针对你个人的价格。

但是最近几年时间,关于“大数据杀熟”的新闻越来越多。有网友发现自己在订酒店、订机票及打车的时候,同样的商品和服务,使用不同人的手机显示的价格是不一样的。尤其是该平台的老客户,系统会根据其消费次数和之前购买商品的价格等,计算出“合理”的价格并提供给客户。但事实上,这个价格要比新客户的价格高一些。甚至还有网友测试后爆料,在打车时,同样的路程,使用苹果手机显示的价格要比安卓手机的价格高。

价格歧视可以说无处不在,在现实生活中,为了尽可能降低被价格歧视的可能性,人们会通过“货比三家”的方式来填补与商家之间的信息鸿沟。

隐私安全

人脸识别是人工智能领域图像识别能力的一种延伸。随着人脸识别能力的不断增强,它已经逐步被应用到一些场景中,包括刷脸支付、刷脸进站、刷脸签到等。人脸识别的确带来了很多便利,很多人也开始幻想当人工智能时代彻底来临时,人们也将彻底从繁杂重复的劳动中解放出来。不过正如本节标题所写的那样,科技进步也同样带来了新的问题。

根据2021年3·15晚会的报道,一些国际知名品牌的汽车4S店、某卫浴品牌经营层,在消费者并不知情的情况下偷偷获取和利用了消费者的人脸信息。比如,某卫浴门店安装了数个摄像头,而摄像头的作用并不是为了防盗,而是对到访客户的数据进行采集并上传到云端。客户的数据会与原数据库进行配比,很快就能确认这个客户是否是新客户,曾经到过哪些门店,接收过哪些报价。系统将这些信息反馈给门店工作人员,后者根据信息对产品和服务给予不同的报价。不得不说,这也是一种价格歧视,并且发生在当事人并不知情的情况下。

Cookie(存储在用户本地终端上的数据)是埋下隐私危机的主要源头。当用户在浏览不同的网站时,服务器会先在用户的本地计算机上传一部分数据,Cookie会记录用户的一些个人和行为数据,如“下次自动登录”“打开网址仍显示当前页面”等。Cookie的确提升了用户的互联网体验,但是一些隐私数据也被直接暴露给了其浏览的平台。所以遇上“大数据杀熟”情况,用户可以清理Cookie数据来应对。

数据垄断

无论平台或商户主动获取用户的数据,还是用户将自己的数据上传到平台,这些数据如何存储和使用,其实都是由平台主观掌控的,而数据的所有人即用户本身并没有掌控权。尤其是互联网巨头,它们通过用户数据来修正自己的人工智能算法,提升了商品或服务的销售利润,但是并没有给数据的提供者分成。

更有甚者,直接将平台用户的个人数据出售,以获取利润。在2021年3·15晚会上,记者曝光了某些知名招聘平台的大量简历流向黑市:你可以通过某社交软件找到卖家,只需几元就可以买到一份求职者简历。简历上包括求职者的真实姓名、年龄、照片、联系方式、工作及教育经历等,这些全都属于个人隐私数据。如果这些数据流入不法分子的手中,求职者极有可能成为被诈骗的对象。

那么这些数据是如何泄露的呢?很明显这些简历不是求职者本人泄露出去的,那唯一的渠道只有招聘平台了。在这些招聘平台上,只需注册成企业账户即可下载简历。招聘平台并没有健全的审查机制,没有对企业账户的行为进行审查,一方面,这会带来更大的成本,另一方面,这可能会影响平台自身的收益,平台自然动力不足。互联网企业在数据上的垄断不仅局限于用户,还包括除了自身的其他企业。

数据是一种类似石油的资源,是有价值的。这一观点是本书一直在强调的一个重点。

2016年3月,人工智能程序AlphaGo挑战世界围棋冠军李世石,以总比分4:1的压倒性优势获胜。一时间人工智能轰动了整个围棋界和科技界,AlphaGo背后的公司DeepMind名声大噪。不过,不管是普通人难以理解的深度学习,还是卷积网络等专业术语,人工智能的发展都少不了三要素:算法、计算和数据。人工智能更像是大数据分析的升级版,因而数据对于人工智能行业的兴起和发展来说至关重要。

很多人工智能创业型公司有能力开发出能够应用到相应产业的人工智能算法或程序,但是苦于没有大量的数据对算法进行训练。即使想要买数据,也没有企业能够卖给它们。这背后的原因正在于大量的数据被互联网巨头所垄断,而它们并不会轻易地将珍贵的数据让给别人。

如果我们把目光投到人工智能行业就会发现一个特性,目前拥有领先的人工智能研发能力的只有谷歌、百度、阿里巴巴等巨头。这背后的原因是,这些企业通过自身强大的平台和用户量,将数据汇聚到了自己的数据中心。至于其为什么不会轻易将数据与行业分享,一是其具备应有的社会责任,不会将用户隐私数据暴露给外界;二是其需要通过人工智能的持续研发能力,不断高铸自己的“护城河”,占据头部位置。

采用这种战略对于企业本身似乎是正确的,但是对于整个行业而言,这将带来很大的局限性,也会大大制约人工智能行业的快速发展。这种现象更像是在闭门造车,每个企业都需要重复制造轮子,造成了行业资源的浪费。

以上种种科技进步带来的问题,其本质都是数据的存储、确权和流通问题没有得到解决。所以要想找到解决方案,还需要从其本质,也就是数据入手。