引言

数据决策时代,人人都是分析师

我们生活在一个数据泛滥的时代。数据正以惊人的速度在增长,每个人的下一秒都会被更多的数据包围。我们收集数据的主要目的是完善企业、政府和社会层面的决策制定机制。因此,如果我们无法通过定量分析,利用数据实现更好的决策制定,就是对数据资源的浪费,也有可能造成不良后果。因此,本书致力于为你展示定量分析的运作方式,以及该如何利用定量分析做出更好的决策,即使你没有相关知识背景,也无妨。

数据,创新产品与服务的源泉

数据的力量正在各行各业中崛起。如果你热爱运动,那肯定知道《点球成金》(Moneyball)这部电影,影片主角奥克兰运动家棒球队总经理比利·比恩(Billy Beane)利用球员的表现数据和分析学革新了职业棒球运动。现在,这种革新已经延伸到了所有的主流体育项目当中。如果你喜欢玩在线游戏,可能知道星佳(Zynga)和美国艺电(Electronic Arts),这些社交网络游戏公司正在收集并分析用户所有的游戏行为。那电影呢?你也许知道奈飞(Netflix)可以利用算法预测你可能喜欢的电影,好莱坞的一些制片人会利用算法来推断什么样的电影投资回报率高,美国独立电影公司相对论传媒(Relativity Media)就是这么做的。

数据种类各不相同。有的数据因为事务性用途被收集和管理,比如,企业和机构通过跟踪员工上班时间和剩余假期所得的数据。当企业收集到大量数据之后,就希望能读懂这些数据,并在此基础上做出决策。同样地,也可以利用分析学来研究与人力资源相关的事务性数据,企业可能会提出“下一年度有多少员工可能会退休”或者“员工休完所有的假期和其年度绩效考核之间是否存在关联”之类的问题。

不过,数据和分析学的作用并不局限于完善内部决策的制定。像谷歌、Facebook、亚马逊和eBay等许多立足于互联网的企业,都在利用收集网上交易数据所形成的大数据来支撑决策制定以及为客户提供新产品和服务。无论你是想实现更富成效的内部决策,还是想为客户提供更具价值的产品,分析学必不可少,它会对数据进行汇总、分析,并找出其中的含义和内在关联。要读懂并挖掘出数据的价值,必须借助数学或统计分析,简单地说,就是分析学。

人人都是分析师

数据分析的本质

一般情况下,我们所说的分析是指,使用大量数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策过程与实现价值增生。

根据分析的方法和目的,分析可以被划分为描述性分析(descriptive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)。描述性分析包括数据收集、整理、制表、制图以及描述正要研究的事物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。

预测性分析不仅可以对数据特征和变量(可以假定取值范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析首先会确定变量之间的关联,然后基于这种已知关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关联做出的,但这并不代表预测性分析都需要明确因果关系。事实上,准确的预测并不一定需要基于因果关系。

规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在处方上建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他无关的变量。如果处于实验环境下的测试组的表现大大优于对照组,决策制定者就应该立即推广这种实验环境。

优化是规范性分析采用的一种方法,指试图识别出一个特定变量与另一个变量之间理想的关系水平。例如,我们可能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使零售企业最大限度避免缺货情况的库存水平。

根据分析采用的方法以及收集和分析的数据类型,我们可以将分析分为定性分析(qualitative analysis)和定量分析(quantitative analysis)。定性分析的目的是深入了解某种现象出现的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来,并进行了非统计性的分析。定性分析是分析的最初阶段,它通常是探索性研究的有效工具。定量分析是指通过统计、数学或计算的方法对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。

为了服务于研究者的不同研究目的,存在以下几种类型的分析:

 

·统计学:收集、整理、分析、说明和呈现数据的学科。

·预测:根据已有数据,预测一些感兴趣的变量在未来某个特定时间点的情况。

·数据挖掘:通过使用算法和统计技术,自动或半自动地提取大量数据中未知的有趣模式。

·文本挖掘:用类似于数据挖掘的方式从文本中得出模式和趋势的过程。

·优化:在同时满足约束条件的情况下,按照某些标准,利用数学方法来寻找最优的解决方案。

·实验设计:给各组随机分配被试,然后使用测试组和对照组来推导出特定结果中存在的因果关系。

 

虽然此处给出了一系列常用的分析方法,但在使用的过程中,会不可避免地出现相当大的重叠。例如,回归分析(regression analysis)是预测性分析中最常用的方法,与此同时,它也是统计学、预测和数据挖掘中常用的方法。此外,时间序列分析(time series analysis)是用于分析数据随时间变化的一种具体统计方法,在统计学和预测中也经常被用到。

 

上文提到的支撑人力资源决策的事务性数据是定量分析的结构化数据,其数据量相对较小,即使是大型企业,可能也就只有1TB或2TB。过去,分析就是发生在这样的环境中,因此,就让我们将其称为“小数据”吧。过去,分析学别无选择,必须针对小数据。

现如今,令大企业、非营利性组织和小型初创公司激动不已的是大数据。大数据是大量的非结构化数据,其来源极为广泛,可能来自互联网上的在线交谈,或者摄像机的连续镜头,或者医院患者的DNA分析。这类数据量非常庞大,甚至达到拍字节(PB)的程度。比如,谷歌每天要处理24 PB的互联网数据;美国电话电报公司(AT&T)每天要转换30 PB的语音和数据通信数据。如今,通过新型软件和硬件技术,我们可以分析大数据并挖掘出其蕴涵的意义。

人人都是分析师

数据即未来

大数据一词指的是数据量异常庞大且多种多样的非结构化数据。以下是一些例子:

 

·社交网络游戏公司星佳每天要处理超过1 PB的游戏数据。

·YouTube用户每天观看超过10亿小时的视频。

·Twitter用户每月进行320亿次搜索。

·2011年,谷歌用户每天进行近50亿次搜索。

·2009年,全球每天发送的短信超过25亿条。

·2010年,世界各地的手机使用量达到50亿台。

·经过全面分析,一个人类基因组包含大约1TB的数据。

·评估一头奶牛健康状况的无线传感器每年会传输200 MB的数据。

·2008年,连接到互联网的设备的数量超过了全球人口的总量。

·据思科系统公司(Cisco Systems)估计,20种常见的家用电器产生的上网流量超过了所有互联网用户在2008年间产生的上网流量之和。

·麦肯锡咨询公司预测,在美国的各行各业,职工超过千人的企业存储的平均数据比美国国会图书馆(Library of Congress)的数据还要多。

 

大数据和分析学会改变各行各业的商业职能。任何组织或个人只要抢先一步掌握大数据,就会奠定至关重要的竞争优势,就像在小数据时代占据先机进行数据分析的人能在竞争者中脱颖而出一样。因此,企业和组织机构必须抓住大数据的历史机遇。

大数据的潜能之所以能得到激发,是因为计算和数据收集设备的普及,而传感器和微型处理器即将无处不在。基本上,任何机器或电子设备都会遗留下有关性能、位置和状态的数据,而这些设备及其用户通过在互联网上的沟通又催生了一个海量数据源,当所有这些数据与由其他媒介,如无线和有线电话、电报、卫星等媒介生成的数据结合起来时,数据的未来岂止于大。

如果所有这些数据都可用,就意味着基本上所有的企业和组织行为都可以被视为大数据问题或者大数据行为。在制造业内,大部分机器设备已经配置了一个或多个微处理器,大数据的氛围越来越浓烈。随着消费者的选择日趋多样化,市场推广早就成为一种大数据行为。谷歌也将其无人驾驶汽车项目定性为大数据项目。

许多企业的首席执行官曾公开表示,分析性思维和决策制定是企业成就和个人财富的来源,其中凯撒娱乐集团(Caesars Entertainment)的首席执行官加里·拉夫曼(Gary Loveman)就曾说过:“我们思考了吗,或者说我们知道结果了吗?”亚马逊首席执行官杰夫·贝佐斯(Jeff Bezos)曾说过:“我们对数据来者不拒!”领英联合创始人兼董事长里德·霍夫曼(Reid Hoffman)也曾说过:“Web3.0就是数据。”

各行各业的企业都应意识到数据的肆虐来袭,它们需要能对其进行详尽分析的人,这类人虽然有着不同的称呼,却有着同样的身份,那就是数据分析师(quants)。不过,《成为数据分析师》并不是为这些十八般分析武艺样样精通的人所著。本书的目标受众是能基于分析结果制定出好决策并采取行动的人,这些人虽然是企业内部的非定量分析人员,但需要基于定量数据和分析来开展工作并制定决策。

一场探秘数据之旅

我和托马斯即指托马斯·达文波特,此段是金镇浩的笔述。——编者注的学术背景虽然有所不同,但阐述这个话题的目的相同,都是希望扩大分析性思维在商业和社会层面的运用,特别是帮助非数据分析师更好地利用数据。托马斯自身也不是真正意义上的数据分析师,事实上,作为有着学术背景的社会学家,他的统计能力相对薄弱,不过,在分析学以及分析学在商业领域上的运用,他就是权威。几十年来,他一直致力于就如何培养分析能力进行调研、创作、教学和企业咨询。他一直与管理者共事,而通过帮助他们利用分析学所得的工作经验正是本书的创作基础。此外,他还是畅销书《数据分析竞争法》(Competing on Analytics)和《数据化变革》《数据化变革》(Analytics at Work)(暂定名)一书构想了未来可能的数据化场景,并提示企业和个人如何利用数据化思维制胜未来。本书中文简体字版将由湛庐文化策划,浙江人民出版社出版。——编者注的第一作者,这两本书聚焦大企业是如何利用分析学制定商业策略的。不过,在《成为数据分析师》这本书中,他将注意力转移到了个人身上,关注个人如何培养分析技能,确定分析方向。

金镇浩(此处是达文波特的笔述)的商务和统计学学术背景注定他是一名真正意义上的数据分析师。他一直在研究如何利用分析方法解决商业和社会领域的众多问题,还创建并运营了一个教育项目,以培养个人的分析技能。在韩国,金镇浩是一位商务和统计学教授,出版了6本著作,其中《100个统计学常识》(100 Common Senses in Statistics)和《怪诞统计学》(Freak Statistics)旨在帮助非统计学家更好地理解和通晓统计知识。

此书旨在帮你更好地利用数据,更深谙分析学之道。有了此书,与数据分析师共事将不再那么艰难,在与他们就其所进行的分析对话时,也有可能碰撞出火花。此书还能让你学会定量分析的行话,让你问出行内人该问的问题。说不定,你也会变成数据分析师呢!

数据分析师如何从0到1

企业管理者能通过多种方式,与企业内部的定量分析师亲密合作,利用分析学提升决策制定的效率。让我们看看最近珍妮弗·乔伊(Jennifer Joy)在美国保险公司信诺(Cigna)制定的一项决策。乔伊是临床手术部门(Clinical Operations)副总裁,她管理着该公司庞大的客户服务中心。该客户服务中心帮助信诺的客户增强体质,特别是有慢性病、需要长期治疗的客户,比如患有糖尿病和心脏病的客户。乔伊本是一名护士,并不是分析师。不过,她读过MBA,也笃信分析性思维的重要性。她的案例展示了分析性思维的两个方面:定性问题和找出问题的正确答案,她的这种分析性思维帮助公司和客户节约了大量成本。

乔伊的工作面临的一个首要决策是,该花多长时间在客户的慢性病管理上,也就是告诉他们如何预防疾病或者如何防止疾病的扩散。一方面她想确保自己确实有帮助到客户,另一方面还要合理控制公司的成本。对于她来说,主要的结果变量就是信诺的客户是否入院或再入院。一度,她手中有几十页的月度报表,里面记载着客户再入院的频率,这个频率时高时低,但到底是什么引起了它的波动,乔伊不得而知。“我掌握了很多数字,但它们只是数据而已,不能回答深层次的问题,即‘这说明了什么’。”乔伊真正想知道的是,客户打电话给信诺之后,在身体健康和住院这两个问题上,到底有没有获得答案。

为了更深入地了解慢性病管理和住院率之间的因果关系,乔伊向信诺的一些分析学专家寻求帮助。迈克尔·科辛斯(Michael Cousins)和其同事组成了一个分析团队,由科辛斯牵头与乔伊一起深入探究这个问题。科辛斯说:“乔伊虽然并不是全然理解因果关系背后的各种推理细节,但是,她是一个逻辑性强、爱钻研的人,而且提出的问题非常睿智。她对定量分析并不是那么敏感,但非常注重分析。与像她这样的决策制定者共事,分析团队打着灯笼也难找。”

在信诺,科辛斯的团队专注于让分析方法和业务需求相匹配。他的团队认同乔伊的观点,即有关住院情况的数据派不上什么用场,因为它并没有回答乔伊提出的因果关系问题:在客户的健康状况和住院这两个问题上,临床医生的建议到底产生了什么样的影响。换言之,已有的报表采用上下波动的方法并不适用于解决她所提出的业务问题,因为在决策制定的过程中,没有可靠的对比或者参照组作为基础。比如,原来那些报表并没有根据客户病情的轻重情况进行配对,有的病人的病情会更危急一些,有的则会缓和一些。于是,科辛斯的团队创建了一种病例配对方法,将健康状况、人口统计数据、生活方式和住址相近的患者进行配对。然后,每一对配对成功的客户中的一人将接受慢性病管理与督导,而另外一个人则不接受,如此一来,乔伊就能确定这种管理和督导的效果到底如何了。科辛斯指出:“对乔伊来说,去调研这些干预是否真的有效是需要勇气的,因为这毕竟是她公司的主要业务,但她为了找出真相,义无反顾。”

结果表明,客户服务中心提供的有些干预对很多疾病来说,并不能达到预期的效果,但在乔伊他们意想不到的一些疾病上,却又卓有成效。对于前一组客户,乔伊决定采取行动,缩短患有特定疾病的客户的通话时间,直到确定客户服务中心提供的服务为客户带来效用为止。对于后一组客户,他们则增加和调遣了客服人员,以为客户提供更具附加值的活动。乔伊还和科辛斯的团队在其他分析项目上进行了合作,包括对照实验(controlled experiment),以测试不同的督导方法,比如与客户的医生进行更深入地接洽。在究竟哪种方法会奏效这一问题上,她并没有依靠直觉去判定,而是坚定地遵循结构化分析的理念,比如说利用“测试与获知”(test and learn)这类大数据分析分法,每年进行二三十次测试来判定。

乔伊原本就擅长分析,现在,通过和专业人士的合作,她又掌握了分析工具,可以将所思所想付诸实践,然后做出以事实为依据的决策。虽然通过电话为客户提供医疗服务的理想方式依然有待发掘,但至少现在,信诺将更多的精力放在了事实证明有效的方法上,减少了花在那些确实不起作用的方法上的冤枉钱。对于科辛斯和其团队来说,也在与乔伊和信诺其他善于分析的高管的合作中获得了好处,他们变得更善于用商业术语表述分析结果,传达分析对于客户和经济效益的意义。

因此,《成为数据分析师》并不是为像科辛斯这类分析人士所作,而是奉献给全球如乔伊这类具有分析头脑的人的。不过,我们并不是说希望你变成一位技艺了得的定量分析师或者数据科学家。首先,这不是单单通过读这一本书就能实现的,这需要大量的积累和学习;其次,并不是每个人都喜欢这一行,也不是每个人都有这个能力。

事实上,我们就是想让你具有数据化思维或者分析头脑,即对数据和分析有渴求,在工作中利用它们做决策,并在公司内部提倡这种做法。我们希望人们对你的评价是“他对数据富有激情”,或者如同评价乔伊这样:“虽然她自身不是什么数据极客,但她理解并欣赏他们的工作。”我们虽然没打算让你从事什么复杂的数据分析工作,但希望你成为它的消费者,而且是精明的消费者,利用它来制定决策,提出与数据和分析方法相关的问题,理解分析结果并利用其提升你的企业业绩。改述哈佛大学统计系孟晓犁先生的话来说就是,借由这本书,我们并不是想让你成为专业“酿酒师”(他为统计学博士讲课时用了这个词),只是想让你成为美酒行家。

过去,如果对分析的创建过程了解不充分,就很难有效地利用分析。不过,如今情况大有改观。就像做一个好司机一样,你不需要知道内燃机的工作原理,大多数情况下,在利用统计数据制定决策时,你也无须知晓统计数据是如何计算的。现在,越来越多繁重的工作是由分析软件来未完成的,有时它甚至需要根据你的数据和参数的属性,自行决定应该进行哪些统计分析。更有甚者,一些新的分析软件,比如SAS公司的软件具备一种叫“什么意思”(what does it mean)的功能,它能简单明了地解释相关的意义或阐述统计预测采用的是哪种计算方法。

虽然时代呼吁我们充分利用分析,但迄今为止,还没有一本以通俗易懂的语言对其进行详细阐述的书籍来帮助新手掌握分析技能。《成为数据分析师》描述了分析是什么,并用众多真实案例展示如何将分析付诸实践,并为读者提供了提升分析能力的方法。本书能帮助你更深入地理解分析,并提供就问题的分析解决方案与企业内部人员进行有效沟通的方法。

分析型决策,更精准的决策

企业和组织的决策制定可能会基于众多因素,包括个人经验、直觉、实验或者分析和数据。就像电影《点球成金》中分析在职业棒球上的运用一样,并不是说有了分析,成功就有了保障;电影中的奥克兰运动家棒球队当时并未能拿下整个赛季的所有比赛,之后也未出现过在整个赛季中无败绩的情况。然而,利用分析学的人还是占据了一定的优势,正如奥克兰运动家棒球队一样,球队大牌少得可怜,但其表现总是超乎人们的想象。当然,不能排除也有决策制定者单纯依靠经验和直觉就能制定出好的决策,特别是当他面临的是自己经常碰到的问题时。

几乎各行各业的现实情况都表明:分析型决策制定更精准,而且会产生更好的决策效果。在职业棒球中,几乎所有的球队都在使用奥克兰运动家棒球队首创的分析方法,甚至是曾经为自己挑选队员并以非分析型方法和比赛策略引以为傲的纽约扬基队(New York Yankees),现在也聘请了21位棒球统计学家。

在商业领域,传统数据分析主要用于支撑企业内部决策,并回答如这样的决策问题“这个产品我们应该卖多少钱”或“什么样的促销活动有可能让某个客户购买我们的产品”。在大数据背景下,分析常用于为客户提供新产品或为已有产品开发新功能,如谷歌搜索引擎的网页排名算法,社交网站领英上的“你可能认识的人”“我应该与哪些人交往”的功能,或者星佳开发的新游戏。这依然是一种决策形式,不管该决策是企业自身做出的还是由消费者做出的。在这本书中,我们会列举出很多案例,如政府部门、医疗保健和体育行业等都可以从中受益。

当一个决策者评估备选决策时,会基于两种信息源对这一决策进行考量:来自定量分析的信息和来自非定量分析的信息。非定量分析的信息是指来自直觉、经历、经验法则、传闻和猜测等途径的信息。这些信息有时是有用的,但也存在众多问题。即使你在决策制定方面拥有很多经验,但经验的弱点是,它并不具备普适性;猜测总是存在风险;一般情况下,你也不应该相信直觉,而大多数人过于看重直觉,并视其为决策制定的指南。比如,行为经济学就认为,在处理经济问题时,人们显然不是一个好的直觉型决策制定者。能通过分析来制定的商业决策有很多,见图0-1。

图0-1 可以通过分析来制定的商业决策

尽管分析有很多好处,但它并不是决策制定的万能法宝,有些情况并不适合使用分析来制定决策。如果是无关紧要的或者与个人偏好相关的决策,就没必要浪费时间和精力去收集并分析数据了。另外,如果你必须迅速做出决定,可能就没有时间去采用什么分析方法。如果你需要制定的是一个一次性的决策,可能会觉得如此麻烦地收集数据、建立分析模型并不值得。总之,适合采用分析方法来制定的决策是那些需要反复制定,能够留出一些时间进行分析,而且足够重要,并对得起花费的人力和物力的决策。

3个阶段、6个步骤,人人都能成为高效的决策者

《成为数据分析师》的核心部分描述的是分析性思维的三个主要阶段。全书用三个章节分别对分析性思维的三个主要阶段进行了详细描述,同时给出了一些分析实例,这些案例都有一个特点,就是其中有一个特定的分析阶段对整个分析工作来说至关重要。图0-2展示了这三个主要阶段以及每个阶段采取的分析步骤。

图0-2 定量分析的3个阶段和6个步骤

第1章讲述的是分析性思维的第一阶段,即构建问题。构建问题的目的是确定分析工作要回答什么问题,以及基于这个问题的答案要做出什么样的决策。构建问题是一个非常重要的步骤,因为如果问题是错的,就算收集再多的数据和进行再复杂的分析,你也无法得到正确的结论。构建问题有两个步骤,一个是识别问题,另一个是回顾之前的发现。在第1章中你会看到,一旦你认为自己已经认识了某个问题并确定用分析方法来解决它,那你很可能会发现别人已经解决了这个问题的某些方面,而这通常能帮你更好地构建问题。

第2章重点论述了分析性思维的第二阶段,你可能会认为这个阶段是分析工作中最重要的阶段,即解决问题的阶段。在这个阶段,需要确定模型中采用的变量,并收集测量这些变量的数据,然后实实在在地进行数据分析。如果你自己不是一位定量分析师,且没打算成为定量分析师,那么大部分工作你可能会和定量分析师一起开展。然而,对于你来说,知道哪部分工作是重要的且熟悉操作过程仍然是非常有用的。虽然你也许无法独立解决问题,但你提出的问题和提供的见解会大大有助于定量分析师得出一个更好且更有效的解决方案。

第3章着眼于第三阶段,也就是最后一个阶段,这个阶段和其他两个阶段同等重要,却往往被忽略,即传达结果并基于结果采取行动。你如何传达分析结果是至关重要的,因为这直接关系到这个分析结果是否会导致某种行动。如果一位决策制定者(也许就是你)不理解分析师所做的工作和分析结果代表着什么,那么他就不会乐意基于这个分析结果来制定决策。如果真是这样,那么前面两个阶段的工作你就白做了,还不如不做。我们生活在一个博眼球的时代,因此以一种妙趣横生、能够吸引注意力的方式传达分析结果是非常重要的。你不能以纸上谈兵的方式来展示你的报告,更不要期望任何人会被这样的报告打动,而应基于报告上的内容采取相应行动。

接下来的章节将着眼于与分析性思维相关的一些特定问题。其中,第4章讨论的是如何在分析工作中发挥创造力,这两者水火不相容。第5章给出了一些帮助你培养分析能力的方法,当然,前提是你要有这种想法。

第6章描述了一些需要用到分析的非定量分析人员与定量分析师一起有效工作并达成更好的决策的好方法。不用说,这肯定是一种互惠互利的合作方式。全书列举了大量来自各行各业的分析案例,展示了分析是如何被用来解决问题的。书中也提供了一些详细注明了如何应用分析的操作单,还有部分内容强调了立即进行分析性思维的简单方法。

人人都是分析师

一个轻率的决策足以毁掉一家巨头企业

无论是正面案例还是反面案例都能让我们获益,但是反面案例往往更令人印象深刻,所以我们不妨来举一个反面例子。乔·卡萨诺(Joe Cassano)的例子应该是最令人印象深刻的了,几乎可以说是他一个人摧毁了一家巨头企业,甚至是美国乃至世界经济。真是见鬼!

卡萨诺到底做了什么,以及他没弄清楚的究竟是分析工作的哪个部分呢?对于卡萨诺其人,我们一提他的头衔,你可能就会有点印象,他原是保险巨头美国国际集团(AIG)旗下的一个由400余人组成的全资子公司,即金融产品公司(AIGFP)的首席执行官。他目睹了一笔数额巨大的金钱的流失,虽然确切的金额仍有争议,但差不多就是850亿美元,因为美国纳税人从自己的腰包里掏出来用以帮助金融产品公司维持经营和清偿债务的钱就是这么多。虽然要为这笔金钱的亏损负责的不仅是卡萨诺一人,但正如专门揭发名人丑闻的记者马特·泰比(Matt Taibbi)在《滚石》(Rolling Stone)杂志中写到的一样,他是导致“全球经济衰退的第一感染源”。泰比还描述卡萨诺为“一个又矮又胖、长着豆子眼且前额过分突出的布鲁克林大学毕业的秃子”,不过这不是我们关心的问题。毕竟,如果他不是让金融产品公司亏了这么多钱,而是赚了不少钱的话,我们相信他的形象不会这么糟糕。

那么,分析和定量分析到底是在什么地方起作用,或者更精确地说,到底是在什么地方缺少了分析和定量分析?金融产品公司之所以亏损了这么多钱,是因为它出售了一种名为信用违约互换(Credit Default Swap,简写为CDS)的金融产品,换言之,就是提供信用违约保险,保险标的是为抵押贷款支持衍生品的价值。格蕾琴·摩根森(Gretchen Morgenson)是《纽约时报》的记者,他在这些事情发生不久之后指出:“虽然美国的房市崩盘经常被认为是导致金融危机的原因,但事实上,是因为以信用衍生品而著称的错综复杂的金融合约为债务持有人提供违约保险,造成了金融体系的脆弱不堪。这些金融合约悄悄地流行开来,并避开了监管者的监管视线,有时候甚至是卖这些金融合约的企业高管都不明白这些金融合约到底意味着什么。”

卡萨诺显然就是不明白这些金融合约的高管中的一员。事实上,衍生品和信用违约互换都是基于数学和统计学的复杂的金融产品,但不幸的是,就如最后的结果所证明的一样,是基于错误的数学和统计学知识。如果办理了按揭贷款的借款人不再具有偿还贷款的能力,衍生品便将变得一文不值,而金融产品公司就会被迫支付给投保人衍生品的保险价值。说到这里,一切也就明朗了,事情就是这么发生的。

迈克尔·刘易斯(Michael Lewis)在《名利场》一书中描述了金融产品公司业务部存在的核心问题:

 

金融产品公司的交易员说,金融产品公司是为何以及如何从一颗摇钱树变成一场巨亏灾难的原因有些错综复杂,但金融产品公司从兴盛走向衰落的起点却非常简单,就是管理层的变化导致了决策制定方式的变化。2001年年底,该公司的第二任首席执行官汤姆·萨维奇(Tom Savage)退休了,萨维奇在位时的二把手卡萨诺被提拔为首席执行官。萨维奇是一名训练有素的数学家,对金融产品公司交易员用来进行风险定价的模型了如指掌,从而能够确保合理的风险定价。萨维奇还喜欢针对金融产品公司的各种业务模型和指标进行辩论。然而,卡萨诺几乎不懂数学,且对辩论不太感兴趣。

 

卡萨诺并不关心潜在风险的评估以及定价模型是否准确。他没有意识到开发出这些模型的美国国际集团和华尔街的分析师们提出的棘手问题,只是把大量的信用违约互换出售给任何愿意为之买单的人。信用违约互换是建立在这些申请了低质量抵押贷款的人有能力偿还贷款的基础之上的。卡萨诺好像从来就没想过这个假设可能是错误的,也有可能他确实想到过这种可能性,但并不为之担心。

 

对于新手来说,通过自学以提高分析能力并非易事。我们已经搭建了一个网站:http://keepingupwiththequants.weebly.com,读者可以在这个网站上询问分析相关的知识、技术或者正亟需解决的特定问题。在这个网站上,请畅所欲言,你可以提出任何问题。该网站也对本书中描述过的一些案例进行了详细分析,我们偶尔也会在本书中借鉴这个网站上的内容。

想知道托马斯·达文波特最推崇的三种分析法吗?

扫码获取“湛庐阅读”APP,

搜索“成为数据分析师”查看彩蛋。

什么是彩蛋

彩蛋是湛庐图书策划人为你准备的更多惊喜,一般包括①测试题及答案②参考文献及注释③延伸阅读、相关视频等,记得“扫一扫”领取。