从数据里找新闻

做记者最重要的是要拥有信源,所有新闻都不可能是记者坐在电脑前编出来的,都需要有真实事件支撑或者通过采访获得可靠的信息。如今,数据也成为信源之一,甚至不用出去采访就可以找到。

“数据是新闻的另一种信源。”瑞安·索恩伯格(Ryan Thornburg)教授在一次数据新闻的讲座中说。

索恩伯格教授开设了“数据驱动报告”和“媒体经济学”两门课,同时他也是学院里斯新闻实验室的主任,开发了利用数据降低信源成本和提高新闻质量的工具和技术。

现在全球各地无论政府、组织、企业还是个人,每天都在生产海量数据。分析和研究这些数据可以发现大量有价值的新闻,并且以视角独特的报道形式广为传播,这就是当前新闻行业中颇为热门的数据新闻(Data Journalism)。

其实,数据新闻比我们想象中起源得更早。它源于20世纪50年代,美国记者利用大型计算机在政府提供的数据库中分析信息、发现新闻线索,或者利用这些数据发现、拓展报道深度。

数据新闻的操作过程不是一般意义上的新闻采访,记者并不依赖传统新闻实务技能完成采访、调查和文章写作,其主要工作是对数据的整理分析。用数据说话,最直接的优势是可以有效避免记者的主观观点,增加可信度。如今的数据新闻主要来源于对大数据的挖掘与处理,其结果可以通过复杂的、交互式的、动态化的图片和视频来呈现。

索恩伯格教授总结了记者进行数据研究时的几个关键问题:有什么遗失的?什么是正常的?什么是不正常的?原始资料是什么?现在的情况是什么?

“把这些问题都搞清楚后,你对掌握的数据就会有个方向,知道新闻点在哪里,可以从哪里着手整理。”

索恩伯格以彭博社的一些报道为例。“彭博社拥有庞大的财经数据库,你可以分析过去3年、5年或100年的股票涨跌情况,随时用一个时间点来进行数据分析,比如特朗普当选、英国脱欧等关键日期,不同的选择会产生不同的新闻解读。这是最简单也最容易操作的。”

2017年,美国东南海岸的飓风发生后,多家媒体在网络上利用大数据制作了各种各样的新闻。当时的数据新闻包括天气情况、历史上飓风的发生情况、各地受损情况等,媒体将这些数据用谷歌融合图表制作出来,可视性非常强。

索恩伯格说:“你可以从图表上直接输入你需要了解的地址,就会出现当地的新闻、图片、视频、动态谷歌卫星实景、损失情况等,实用性很强。这些是一般媒体报道形式做不到的,比起一般的电视和平面媒体报道表现更清晰,传播力和说服力很强。”

美国有一个数据新闻记者联盟,记者可以就某一选题在联盟内寻求帮助,由不同地点的记者协助调查。“大家都在互联网上分享,比如我想分析飓风过后各地对佛罗里达州的捐赠情况,会有各地的数据记者帮忙找到相关数据。”索恩伯格介绍。

大数据还可以应用于为读者提供个性化服务。2014年,美国的数据博客FiveThirtyEight就通过数据分析回答读者提问。此外,通过读者的阅读习惯进行定向新闻的推送,也是数据分析的结果。

根据用户需求提供个性化的大数据服务,将成为未来的发展趋势。专注于此的媒体有一个共性,就是致力于以用户的需求为中心,利用大数据诠释宏观社会现象对用户的影响,或者回答用户困惑的问题。媒体可以精准定位,经过后台计算,按照用户的接收习惯、工作习惯和生活习惯,将特色服务推送到用户眼前。

在国内,财新传媒一直走在数据新闻和可视化领域前列。财新早在2011年就开始了数据新闻报道领域的探索,之后持续发力至今,也可谓始终保持着新闻生产的“供给侧改革”;其间,经历从可视化信息图、计算机辅助报道、融媒体报道到大数据新闻,再到数据新闻的商业化尝试,无论是报道形式还是生产方式,都一路在前进中融合,在融合中创新。自2015年以来,财新数据新闻团队制作、发布的《周永康的人与财》《从调控到刺激,楼市十年轮回》《像市长一样思考》等作品,先后获得国内外专业奖项。2017年,《洪水暴至》获得亚洲出版业协会(SOPA)新闻报道创新奖,《移民去远方》等两件作品入围凯度信息之美比赛长名单。财新网也作为唯一的中国媒体,入围由全球编辑网络(Global Editors Network)主办的2016年数据新闻奖(Data Journalism Awards,DJA)。

财新的编辑们除了对专业深度报道做出形象化和互动性解读,还会选取一些公众普遍感兴趣的过往事件提炼、制作数据新闻,比如对奥运会、奥斯卡奖项的数据分析,对各种纪念日的回顾与总结等,传播效果甚至超出编辑记者的预期。因为数据可视化所能呈现的已不单纯是简单的数据罗列,而是囊括了数字、图片、视频,从事实描述、逻辑链条、人物关系等方面,使读者有身临其境的感觉。怎样从财经新闻的枯燥乏味中走出来是一个世界性难题,有时要交代清楚一些相对复杂的资金关系,文字记者需要耗费相当多的笔墨,而数据可视化则可以比较清晰地呈现出各种盘根错节的股权关系、交易结构。

下面我们再分享一个从数据里找新闻的经典案例。

谁能想到,在美国西北部免税州俄勒冈州波特兰市郊区一座破旧的住宅里,竟然注册了1300家公司!“这简直是一个世界商业中心。”美国城市商业杂志社驻北卡罗来纳州的编辑招聘和发展主管贝斯·亨特(Beth Hunter)说。他隆重介绍的是《波特兰商业杂志》(Portland Business Journal)。这本杂志的记者马修·基什(Matthew Kish)耗费三年时间,披肝沥胆,完成了对上述公司——当然都是些空壳公司——的内幕调查,并因此获得2016年多项美国全国性商业新闻奖和调查新闻奖项。

马修的报道题为《空壳公司游戏》(The Shell Game),文章以一个德国移民本特·斯滕博克(Bengt Stenbock)为主要线索展开。斯滕博克于“二战”时期来到美国,在美国军队担任翻译,之后改行在波特兰做了一名保险经纪人。他曾在华盛顿州温哥华创建了一家飞机经纪公司,1982年因毒品走私和电信欺诈被判有罪。再后来,他脑洞大开,搞起了空壳公司生意,通过虚构的人名、不存在的地址、编写虚假合同来获得佣金,先后将1300家空壳公司注册在波特兰那座郊区住宅。这样做的主要目的是隐藏资产,从而洗钱、逃税,甚至资助恐怖组织。

1995年,联邦调查局开始大规模调查斯滕博克和他的公司,但由于注册程序仍属合法,相关涉案人员并未受到刑事指控。这次调查显示出俄勒冈州在法律和执法方面的漏洞。当时的研究表明,美国在消除滥用空壳公司方面相对落后,而俄勒冈州是纪录最差的州之一。

马修在得知上述线索之后,决心把这个毛线团一般的故事讲清楚。由于相关的文件并未公开,他于2012年开始通过公共途径向联邦调查局申请获得文件。联邦调查局在31个月内,分5次发布了超过1700页文件,内容非常庞杂,涉及“成千上万的受害者”和“数亿人的欺诈行为”。

面对上千家匿名公司与个人,马修需要有足够的毅力和决心,以及对公共文件的深刻理解,才能从中找到相关联的线索,并有逻辑地组合起来。他通过不同渠道一一查找这些公司的注册记录、执法文件和民事诉讼文件,重新联系,还原其中的链条,三年之后完成的报道展示了这家“空壳公司运营商”的来龙去脉,以及它给全球经济带来的影响。

最终的报道采取了多媒体组合方式:一篇刊发在杂志上的深度报道、一篇未出现在杂志上但刊登于网络的解释企业保密问题的文章、美国前参议员卡尔·莱文的答问以及记者本人的采访笔记、一则讲述空壳公司工作原理的音频,以及一个专门的数据页面,用于记录3年来报道中所有的数据和内容来源,包括联邦调查局文件、民事诉讼文件、警方报告和监管投诉。

2016年,揭露空壳公司的报道在美国大量涌现,包括著名的“巴拿马文件”。巴拿马文件是指,2016年4月国际调查记者联盟公布的一份调查报告,涉及1100万份机密文件,揭露巴拿马一家律师事务所协助客户洗钱、避税及躲过制裁,全球多位政商名流被卷入其中,引发全球震动。白宫发表声明称将堵住匿名在美国注册公司的漏洞,推动立法,同时要求银行、券商和其他金融机构必须知道并持续追踪账户的实际拥有人。

2016年1月,俄勒冈州宣布将全面立法, 解决空壳公司泛滥问题,扭转10年来政府不作为的被动局面。2017年8月,俄勒冈州州长凯特·布朗签署了一项法案,限制空壳公司的组建和运营。

“马修看上去不是一个咄咄逼人的人,他的特长是很善于研究问题。”贝斯说。他还举了马修的关于耐克的报道的例子,马修在认真研究了耐克公司的财务报表后,发现耐克公司连续多年销量大幅提高,但利润并没有明显提高,从其他费用上,也没看出原因。 “一般情况下,上市公司不愿意回答媒体的各种提问,但马修写出的稿子,让耐克主动来联系他,愿意回答他的问题。这是耐克第一次主动联系记者,因为马修认真研究他们的财务报表,这很重要。”