金兼斌:数据媒体与数字泥巴——大数据时代的新闻素养

日期:2017-01-03作者:梁鹏 浏览量:

摘要

本文从新闻业正在发生的数据革命入手,提出了数据媒体的概念,并把近年来数据新闻的兴起放在数据媒体这一大背景下,认为一切平台都具有数据媒体的潜质,提供了我们认识和把握社会现实的途径。文章探讨了数据化现实的今天,记者的新闻素养的重构问题,认为数据素养将是今日之记者的新闻素养中的核心维度。而数据素养的最简洁的表述,就是记者对数字泥巴的亲近感和翻耕能力。

关键词:数据媒体,数字泥巴,数据新闻,数据素养,新闻素养

新闻业正在发生翻天覆地的变化。在这诸多变化中,对于传统的新闻业和新闻从业者而言,也许最重要的也最为严峻的形势是:不知不觉间,新闻业的从业壁垒和专属领地——不是传统意义上的新闻从业资质,而是实质性的新闻内容生产和传播功能——面临被渠道和技术“列强”瓜分消解的危险。在看似热火朝天的媒介融合大潮中,新旧媒体其实是冰火两重天。占主导的融合模式更多的是新媒体对传统媒体的向下兼容和单向进入。麦克卢汉关于“旧媒体将成为新媒体的内容”的观察这些年一直在残酷的上演着。在新的媒介生态系统中,新兴媒体不断以创新创业者的姿态,挟资本之力而又无需受到意识形态和新闻管制体制之约束,强势切入到内容产业链上游,成为媒介生态系统“食物链”中的上游捕猎者(predator),借助其平台和渠道优势所赋予的用户基础和流量吸引力,像黑洞一样吸食着传统媒体所生产的内容。而且对传统媒体赖以生存的各种优质资源——特别是精英人才和媒体品牌资源——进行策略性的争夺和收编。而传统主流媒体在这一波生死劫中,更多的是一种仓促应战下的被动变革。经过社会化媒体和移动媒体迅速崛起的连番冲击和洗礼,十多年间,传统媒体和新闻业身不由己的经历着社会媒介生态系统的沧海桑田般之巨变。

世界万象正在数据化,现实正在数据化。这也许是我们这个时代的新闻从业者需要意识到的最大的历史转变。在如今的大数据时代,触摸现实、探询真相的努力,也许将不再主要依赖裤腿上的泥巴所象征的风尘仆仆深入现场一线;对于数字泥巴的亲近感和翻耕能力,从数据碎片中还原和拼凑新闻真实的能力,将在很大程度上决定一个新闻业者的核心新闻素养。

不管愿不愿意,承认与否,媒体的概念,新闻的本质,新闻从业者的新闻素养之内涵,似乎都面临着重新界定。

一、作为“记者”的黑客:搅动2016年全美大选背后的一股特殊力量

2016年美国第58届总统选举必将因一系列的狗血剧频频上演为后人津津乐道。在本文写作之时,再隔两天此次大选的投票结果就将揭晓,但临近正式投票日11月8日之前不到10天的时间里,美国民调所揭示的两位主要候选人希拉里和特朗普在可能投票的选民中的支持率,却是一波三折,而搅动这一切的,恰恰是希拉里挥之不去的“邮电门”新进展:

据“环球网”11月1日晚上转每日经济新闻报道,ABC/华盛顿邮报民调显示,特朗普以46%的支持率领先希拉里的45%。这篇题为《“邮件门”有多狠?特朗普民调已反超希拉里》的报道称,即使根据各大媒体的数据综合(不同民调机构因为抽样等原因其得出的候选人支持率通常相互之间会有出入),在10月28日美国联邦调查局(FBI)局长James Comey宣布重启对希拉里担任国务卿期间使用私人电邮调查后,特朗普的支持率也从28日的42.5%上升到45.3%,与希拉里的差距也从4.6个百分点缩小到2.4个百分点。可以说,这是大选投票日之前给近来一直民意支持率大幅领先的希拉里阵营一个“措手不及”的打击。

问题的关键是:FBI为何在大选之前10天这个敏感的时候宣布重启调查?在诸多分析和梳理此次看似热闹的“FBI重启调查影响美国大选”的质疑声、支持声和阴谋论、正义论声浪中,在台面上民主、共和两党,以及国会、FBI之间的斗法故事之外,普通公众通常忽视的一个“核心”情节是:FBI其实也是被逼无奈才决定重启调查的,因为“维基解密和黑客仍在不停公布消息”,FBI新发现的希拉里此前删除的很可能无论如何会被泄露,“如果泄密,联邦调查局公信力就将颜面扫地。”

换言之,维基解密和黑客推动了这一波美国两党政治的博弈进程。微信公号“英国那些事儿”对这一过程中维基解密和黑客的关键性角色作了详细的梳理,这里加以概述如下:

2016年7月5日,此前闹得沸沸扬扬的邮件门事件被FBI调查定性为希拉里“及其粗心大意”但并未有意违反法律,因而“建议不提出起诉”。在美国公众和媒体似乎都已经默认邮件门不会再对希拉里的选举有什么重大影响时,7月22日,“阿桑奇领导下的维基解密公布了希拉里一方民主党委员会内部约2万封的绝密邮件”。这些邮件分别来自民主党委员会的公关主任、财务总监、高级顾问等7位民主党重要官员,内容大多是怎样为了把希拉里推上总统宝座进行的“各种暗地里的勾当”,结果是:“这一个重磅炸弹无疑把希拉里‘骗子’的称号炸得越来越响。”

中间推波助澜的,是希拉里团队里一名重要成员即竞选经理John Podesta的邮箱被黑客“钓鱼”攻破,其中的邮件被黑客全部交给维基解密。于是,从10月开始,维基解密逐渐公布着Podesta这些邮件。“看到这些新一轮曝光的邮件,美国人民彻底坐不住了!”因为邮件揭示,“希拉里不但知道卡塔尔和沙特资助着ISIS,而且希拉里还收了卡塔尔和沙特的钱!”但至此,美国司法部仍未启动对希拉里的指控。

最终让希拉里再次栽进邮件门的人,则是希拉里最信任的助理的前老公Anthony Weiner,此君因为被爆曾经给15岁女生(未成年人)发色情短信被FBI调查,他们没收了Weiner的电脑,并从中发现了其前妻即希拉里的助理的不少邮件,其中不少是希拉里此前在私人邮箱中删除的部分,FBI有了新的证据。换言之,FBI意识到,维基解密现在手里的确有猛料。此前维基解密表示“他们将会在11月份公布这批邮件的最后一波......也就是对于希拉里最致命的一波”,他们声称,这一波消息一旦公布,其证据足以让希拉里直接被捕入狱。FBI正是在这样的情势下宣布重启对希拉里邮件门的调查的。

基于上述梳理,文章援引美国网友的Twitter图片总结:2016年,黑客才是最牛的记者。

值得补充的是,11月6日,联邦调查局在对新发现的邮件进行审阅后,维持此前作出的不建议起诉希拉里的结论。虽然最终黑客和维基解密未能在大选前完成对希拉里的“最后一击”,但其的确已经大大丰富了人们对美国大选、候选人和民主制度运作机制的多面认知,成为倒逼事件真相的一股不可忽视的推动力。

“黑客作为2016年最牛的记者”这个说法虽然来自网民而非权威总结,因此不乏偏颇和戏谑之意。但在笔者看来,其所折射的意义是令人深思的。如果说,新闻教科书上那些曾经改写了政治和社会历史进程和面貌的诸多重大事件的披露——典型如“水门事件”等,大多仰赖记者深入一线现场进行上下求索,那么,进入数字化时代,善于从数字化现实(digitalized reality)中发现和挖掘具有新闻价值的蛛丝马迹并整合各种鱼龙混杂的素材,从中发现或拼接深深隐藏着的“事实真相”,这种能力将成为当今媒体记者必须重视和努力要去具备的技能和素养。因为,媒体的概念已经发生根本改变,数据媒体横空出世。

二、数据媒体与数据新闻

马克思关于人的社会属性本质有一个经典的论述:人是一切社会关系的总和。在网络时代和移动媒体时代,我们的生活正前所未有的网络化。如果说Web 1.0时代是数字化生存(digital being),从Web 2.0开始就是网络化生存(networked being)。从数字化生存到网络化生存,定义着过往十年我们生活方式变化的核心维度。

网络化生存的典型特征就是日常生活对各种平台或网络的依赖。从高德地图、Google地图、百度地图等提供基于位置服务的实时地理信息系统,到各种智能手机上的应用,乃至进行文字输入的各种输入法,作为个体的我们无可逃避的生活在这些平台系统中,成为诸多平台网络中的一个交汇节点(joint dot)。以一个拥有智能手机的用户为例。用户本身成为一个超级终端:他或她是各种信息、娱乐、交流、教育以及衣食住行服务平台或应用的一个交汇点。在这些平台或应用上,每一个这样的“超级终端”所完成的每一项衣食住行的安排和活动,无不通过在此过程中所产生的各种内容性数据(如下单和评论之内容)和行为性数据(如各种记录网上操作的日志数据)——所记录和积累着,并与我们的现实生活严丝合缝的对应。这就是数字化、网络化生活:此前所谓的网上、网下生活,已经基于数据化而统一起来。数据在很大程度上成为我们生活这一“原文件”的压缩版,它因而也具有部分或全部还原我们生活的能力,而且这种能力和趋势随着物联网和虚拟现实、增强现实正在强势嵌入日常生活中越来越多的面向,而将不断加强。正是在这个意义上,我们认为提出数据媒体这一概念已经成熟。

所谓数据媒体,泛指联接广大用户提供各类内容和信息服务、产生实时数据的平台、系统和应用网络。一言以蔽之,平台即媒体。以平台来定义媒体,从概念范畴言,具有向前统摄的可能:传统的内容提供者,包括传统媒体及其所演变和生发的网络媒体、移动媒体固然属于数据媒体,各种Web2.0特征的社会化媒体如微博、微信和客户端,自然也在数据媒体之列;在上述定义下,诸如淘宝、京东等电子商务交易平台,高德地图、百度地图等各种基于位置的服务(LBS),乃至搜狗输入法、各类综合或垂直搜索引擎,因其平台属性,皆可纳入数据媒体范畴。这些服务性应用系统或平台之所以可称之为媒体,根本的原因,乃是因为其具有履行我们所熟悉的媒体功能——包括信息告知和社会监测等核心功能——的潜力和可能,尽管未必有进行某些特殊内容——如传统意义上的“新闻”生产的名义上的资质(license)。但没有新闻生产的资质并不意味着没有新闻生产的能力。如果需要,无论是电子交易平台还是输入法,都可摇身一变,成为新闻和信息推送——甚至是精准推送(precision messaging)的新型新闻传输平台。显然,这在技术上是毫无问题的,各类服务性平台上不时弹出的通知和提示小窗口,正是这些平台新闻推送潜力小试牛刀、跃跃欲试的生动写照。事实上,每一个聚集了大量用户的服务性平台,在其提供服务的同时,很多时候也提供了用户之间进行交流的空间和可能。这使得用户此前需要通过新闻消费——如看电视、报纸、网络新闻——才能满足的信息需求,可以通过服务和社交平台的使用来得到满足。各种服务和社交平台上通过用户个性化的新闻萃取、过滤和改造(典型的如加上自己的推荐和评论以后的有关新闻转发或转帖),然后分享给平台中其他用户或自己社交网络中的“好友”。这种社会化新闻内容的标签(tagging)、过滤(filtering)机制,正在代替传统的针对受众由媒体编辑承担的新闻把关人角色和功能。正是在这个意义上,各种平台不仅因为媒体潜力而消解着传统意义上媒体的不可替代性和存在价值,而且更为“残酷”的是,传统意义上的媒体作为优质内容提供商,成为这些纯粹平台的数据媒体即捕食者(predator)的食物链下端猎物(prey),营养着数据平台所蕴含的附加值(added value)。

综上,我们认为,数据媒体概念之所以有其独立存在的意义,不仅在于其有现实的对应物,是一种值得从理论上去认识、辨析和定性的重要社会现象,更因为其正在对我们的新闻概念、新闻消费和新闻需求满足的方式产生切实的影响。近年来数据新闻的兴起,就离不开数据媒体所带动的新闻传播生态环境的演变。

数据新闻本身并不是新生事物,其前世今生可追溯到肇始自上世纪五六十年代的精确新闻学、调查性新闻和计算机辅助新闻学等思潮和实践。关于数据新闻概念一种典型的理解是,数据新闻包含数据的抓取、挖掘、统计、分析和可视化呈现等新闻生产和传播方式。在笔者看来,数据新闻的本质,是在传统主流的新闻生产方式中,增加了新闻生产者即记者作为一个社会科学研究者(social scientist)的素养要求,换言之,数据新闻的生产过程要像科学研究一样严谨、公开,结果经得起核实和验证。这些都是社会科学研究具有信度和效度的基本原则。

基于我们对近年来我国数据新闻研究和实践的观察,我们发现,当前人们在谈论数据新闻时,大多强调数据的挖掘和抓取以及分析结果的可视化这一前一后两个阶段,而对中间的数据统计和分析重视不够。后者恰恰是传统的精确新闻学所强调的重点。

数据新闻概念,以及数据新闻作为一种新闻生产理念受到重视,与近年来一系列事件,包括维基解密等有莫大关系,但根本上,是随着信息传播技术(ICTs)在世界各国的快速发展,信息传播环境和人们生活方式所发生的巨大变化所致。这种变化正是前述的数字化、网络化生存所带来的日常生活的数据化。而日常生活的数据化最典型地体现在人们基于各种数据媒体平台的衣食住行和内容消费、相互沟通乃至娱乐学习。从某种意义上言,在数据唾手可得的今天,使得“大报小报的记者都可以去探究国家大事”,甚至让关系资源和品牌资源贫乏的小报记者乃至公民记者凭借数据技术优势率先获知或拼凑出众说纷纭中的事实真相,完成草根媒体的逆袭。在媒体层面,数据处理技术正成为确保新闻生产能力的又一种决定性因素,以至于在美国和英国,一些新闻机构开始直接雇佣程序员担任记者,即“程序员记者”。在新闻记者个体层面,提升数据素养则已经成为不少媒体记者因应数据化社会大环境的一种普遍选择。

三、数据素养与数字泥巴

所谓数据素养(data literacy),是指人们有效且正当地发现、评估和使用信息和数据的一种意识和能力。通常,数据素养概念包含数据意识、数据获取能力、分析和理解数据的能力、运用数据进行决策的能力以及对数据作用的批评和反思精神。

在上述构成一个媒体记者或内容生产者的数据素养中,最关键的是对数据的亲切感和直觉。

2005年7月7日伦敦地铁巴士连环爆炸案当日,BBC并没有第一时间在场并获得第一手资料,而是通过公众传回的22000份电子邮件、文本信息以及300多张图片、视频材料才得以还原爆炸发生时的具体情况。通过徜徉在数字和数据世界来触摸和感知现实世界,这就是数据化现实环境下,变革中新闻业给记者素养带来的机遇和提出的挑战。上述BBC这样基于数字化现实片段来进行新闻现场非在场描述和拼接,正成为近年来新闻报道的一种常规手段。

被称为中国第一代真正意义上的新闻记者的黄远生根据自己从事新闻工作的实践,就记者的新闻素养曾提出“四能”说:新闻记者须“脑筋能想,腿脚能奔走,耳能听,手能写。”直言记者在场新闻现场的重要性。这也是新闻史上那些名满天下的大家的共同感受。范长江曾经说过“不亲自经历的事情,每每不容易了解那件事情的真相,所谓事非经过不知难,这话实在一点不差。”范敬宜也强调“离基层越近,离真理越近”以及“要做一名裤腿上沾满泥巴的记者”。

在这里,“裤腿上的泥巴”成为报道事件和现实的记者作为“媒介”连接真实世界(real reality)和媒介世界(symbolic reality)的标志和信物,象征着媒体报道公信力的源泉,关乎大众媒体时代记者职业素养的养成和锤炼。

在数据媒体时代,作为职业的社会新闻播报者,一个合格的记者仍然将是事件现场和不在场民众或用户的中介,是不在场的人们了解事件真相的重要依靠。但数据化的现实,使得民众了解事件现场,有了多种途径和选择,包括大量虽然非专业但可能来自新闻现场的其他民众所提供的各种信息和素材、评论。这些散落或布满在各种平台、网络、论坛、群组种的信息和内容,构成了数据媒体时代探询和还原事实真相的丰沃土壤,可称之为“数字泥巴”。

可以这样说,一个有数据素养的记者,一定是一个对数据有亲近感和直觉的人,他或她徜徉在数据世界中,通过数据来触摸和感知现实。他是一个周身散发着“数字泥巴”气息的人。

精确新闻的倡导者菲利普·迈耶指出,记者要成为数据库管理者。他认为,在信息匮乏年代,记者主要的精力或许在于寻找和获取信息和收集素材;但身处信息丰富乃至过剩的时代,记者的信息处理的能力将是决定其新闻素养和新闻生产能力的重要因素。这就是我们所谓的数据素养,一种与数字泥巴打交道——通过翻耕数字泥巴来洞察和了解世界和现实的能力。

新闻学大家方汉奇先生说过,任何一个好记者、名记者都不是一锤子打出来的,都需要终身学习。新的信息传播环境和新闻业的数字化、数据化演变,已经给专业新闻记者提出新的素养要求。行业的转型要求从业者素养的调适和充实,否则变革的大潮终将抛弃我们,让我们从社会的守望者变成社会和行业发展的观望着。这是一个比此前任何时候都更加激动人心也更加需要自强不息的时代。对于记者而言,这可以是最坏的时代,也可以是最好的时代。

请升级浏览器版本

你正在使用旧版本浏览器。请升级浏览器以获得更好的体验。