新闻机器人的现状新闻机器人与大数据时代数据挖掘的兴起密不可分,经由计算机自动生成的新闻主要集中在高数据密度、高信息透明度、低语境的财经、体育、民意调查和天气等新闻报道中。美联社所使用的Wordsmith平台用户操作简单易行。任何个人或者机构用户都能注册成为该平台的用户。使用者将备有各项信息的数据表格(通常是CSV文件)上传至Wordsmith的云端,就可以开始人机互动式“半自动”的新闻写作的体验。首先将已有的电子数据表格、文件模板粘贴到Wordsmith的操作平台。然后从已经上传电子数据表格中选取数据,将已选数据插入相应的模板。随后系统会自动生成目标新闻文本。最后通过程序语言设计、同义词设定等,可以对文章进行修改,实现文本用词的多样化和复杂化。 经过近年来的广泛应用,学界和业界对新闻机器人所具备的优势达成了以下一些共识: 首先,新闻机器人最大的特点是精准而高产,这显然是得益于软件的不断改进,从而形成了一套精准完整的个性化定制服务,甚至可以精确到微观的个体读者,而这一点是普通新闻记者无法做到的。例如,《纽约时报》客户端今年5月推出的一个新闻专题“全美最宜居和最不宜居的城镇”,由新闻机器人为用户“量身定制”。不同地区的用户不再像以往那样看到的是同一个文本,他们接收到的是根据其IP地址和搜索偏好推送的相关城镇的信息。美国圣路易斯大学传播学副教授麦特·卡尔森精辟地指出:“随着相对重要的新闻事件逐渐转移到个性化私人账户的推送,新闻的定义将被改变,新闻将从集体性叙事变成个性化资讯”。目前最为乐观的估计是,在20年的时间内,新闻机器人将能够胜任任何行业和领域的新闻写作要求。 其次,新闻机器人能够在一定程度上提升报道的真实性、客观性和中立性。新闻客观性一直是饱受争议的话题。部分学者甚至主张,因为人类无法避免错误和偏见,新闻的客观性是几乎不可实现的目标。英国萨塞克斯大学新闻学教授艾弗·盖伯指出,“客观性本身就是一个没有意义的概念,因为所有的记者都会最终屈服于权威,以便得到认可,记者同样也是人,大多数人会随大流,选择牺牲其新闻报道的客观性。”显然,新闻机器人能最大限度地避免人为因素的干扰,保持对新闻真实性的严苛追求,“因为机器人是机器,而不是人”。在运用机器人进行新闻写作的一段时间后,业界对新闻机器人的精确性和客观性给予了正面的反馈。“自动化洞察力”和“叙述科学”公司的跟踪研究表明,相比于人类而言,新闻机器人的错误率和误差率更低。从2014年10月开始,美联社放弃了原有的“基于算法自动生成的新闻需经人工审查”的制度要求,新闻机器人的文本能够直接上线发布。 再次,新闻机器人生成文本的质量和可读性通过了权威的验证。2015年10月,美国宾州州立大学传播学院的学者安德鲁·冈比诺对435人进行了阅读测试。该研究使用了三篇机器人自动生成的新闻作品,分别属于为政治类、财经类和公共健康类。测试结果发现超过半数的受试者认为,三篇文章均为人工写作。随后的研究调查显示,受试者对新闻机器人缺乏信任。进一步的调查显示,受访者更偏爱机器人进行财经新闻写作,对机器人自动生成的政治类新闻保持中立,而对于公共健康类新闻,受访者则更偏爱人工新闻写作。受试者对新闻机器人的信任度同时也受到其所属新闻机构的口碑影响。受试者倾向于给来自主流新闻媒体的机器人更高的评分。因此,媒体自身的品牌和公信力也会对机器人新闻作品的接受度产生影响。 最后,新闻机器人的采用大大简化了生产流程,解放了新闻从业者的劳动生产力。传统新闻生产的“采、写、编、排”等环节被整合成为“信息抓取”和“文本生成”这两个环节,使新闻媒体的劳动生产率得以大幅提升。以财经新闻为例,在公司的财报发布季,记者们往往应接不暇,要花大量时间和精力阅读和整理这些报表和数据,撰写相关报道。由于时间紧迫和媒体机构之间的竞争压力,经常为了抢新闻而发生错报、漏报等“事故”。引入新闻机器人后,大大提升了报道的准确性,并且把记者们从这些事务性的常规报道中解脱出来,从而能够有更多的时间和精力撰写深度报道和评论。 新闻机器人的局限性 即便有着惊人的产出量和高度的准确性,新闻机器人仍然是计算机算法的一种应用延伸,其所存在的局限性也是显而易见的。例如,新闻机器人不能主动发掘新闻线索,无法完全代替记者的主观能动性。 具体来说,其不足和局限主要表现在以下几个方面: 首先是报道主题的局限性。由于新闻机器人是计算机算法逻辑的一种外化与衍生,且以精确的数据挖掘和既定的写作模板作为其高产量的技术支撑。因此,在当前的新闻生产实践中,新闻机器人主要报道的主题限于财经、体育等少数几个领域内,还未全面进入深度调查报道、解释性新闻等“硬核”领域。此外,这类新闻在内容上主要突出其事实性,而缺乏新闻深度的分析和探索,在形式上则有高度模式化、同质化的倾向。新闻机器人在抓取信息数据和生成新闻文本的过程中,能够提供海量信息,却无法直接生成更有深度的解释性新闻或评论。 其次,新闻机器人的广泛运用,会对个人隐私和数据安全带来威胁。在大数据和物联网时代,万事万物都能够被“数据化”,并通过海量云端程序进行数据化联络与沟通。新闻机器人作为一套精心设计的电脑程序软件,在数据抓取过程中,存在着侵犯隐私,滥用数据的隐患。如何有效的界定个人隐私与可使用新闻数据的边界,将成为媒介伦理学需要深入探讨的一个问题。目前,各国网络监管部门尚未对新闻机器人的数据抓取进行有效的规范,存在法律法规层面的“盲区”。因此,在新闻机器人得以广泛使用和推广的大势所趋之下,应该尽快出台或完善相应的法律法规。 再次,新闻机器人的广泛运用将加剧全球新闻传播的“失衡螺旋”。当前全球新闻传播领域,美英等少数西方国家垄断信息和舆论的格局还未得到根本改变。如前所述,新闻机器人的核心技术仍由少数西方媒体和企业掌握手中。绝大多数发展中国家还不具备在这个领域内的自主研发能力,再加上他们在虚拟空间的“网络主权”和在云空间的“数据主权”未能得到有效的保护,因此,新闻机器人在世界范围内的广泛应用非但不能消弭全球新闻传播领域内“双头”(美英)垄断、西强东弱的不平等状况,反而会加剧发展中国家对发达国家在数据抓取、新闻生产、信息流动和议题设置上的“被迫依赖”,从而陷入“强者更强、弱者更弱”的失衡螺旋。 新闻机器人的未来发展趋势 “叙事科学”公司曾经在2012年进行了大胆的预测,15年之内将有近90%的新闻由计算机算法来书写,而未来5-10年内将会有新闻机器人撰写的报道赢得“普利策新闻奖”。 从新闻机器人报道的体量上看,他们的预言正逐渐变为现实。在2013年,单单是“自动洞察力”公司一家就生产了三亿篇新闻文本,这个数字在2014年突破了10亿。该公司声称能够每秒撰写2000篇新闻。仅就内容数量而言,新闻机器人的产出量已经超过了世界上其他各类媒体平台的总和。 从长远来看,新闻机器人的发展趋势表现在以下几个方面: 首先,新闻机器人的生产模式将从基于互联网数据抓取的断点式自动生成模式,逐渐转换到基于物联网持续性数据抓取的自动生成模式。2015年瑞士达沃斯经济论坛上,谷歌公司前首席执行官艾瑞克·施密特做出了大胆的预言:“互联网即将消失,一个高度个性化、互动化的有趣世界——物联网即将诞生”。可以预见在不久的将来,新闻机器人将通过持续不断的获取物联网当中的各项数据,进行更加广泛和深入的数据挖掘与提炼,在新闻报道的广度和深度方面将有明显的提高。换言之,新闻机器人由目前的“写作机器人”发展出“编辑机器人”和“评论机器人”等新的品类并非痴人说梦,集写作、编辑、分析(评论)“三体合一”的真正意义上的新闻机器人终将成为新闻业的中坚力量。 其次,新闻机器人将在一定程度上取代一般记者所从事的程式化的事务性工作,并使记者真正成为像律师、医生那样兼具深厚人文修养和技术素养的高端职业。随着新闻生产的分工将日趋细化和明确,在未来的新闻实务中,新闻机器人将充分其在数据挖掘和分析上的作用,而记者可以专注于调查性新闻、解释性新闻等高品质新闻的生产。有鉴于此,新闻记者的入职门槛也将水涨船高。除了具备传统的人文修养和在文字表达、视觉呈现上的功底,对记者在软件开发、数理逻辑分析等技术素养方面的要求也将相应地提高。 最后,发展中国家将日益重视新闻机器人的产业升级,并出台相应的政策、加大投入,推动相关技术的自主研发。随着全球政治经济格局的重组和调整,中国、俄罗斯等新兴国家有能力、也有实力参与这场新闻业的“创新大赛”,打破美英等国在这项技术上的垄断地位。另一方面,从全球传播的角度来看,新闻机器人的技术革新与网络空间的全球治理紧密相连。如何保护各国的“网络主权”和“数据主权”,为新闻机器人制定一套体现各方利益和诉求的专业伦理规范,亦将成为重构全球新闻传播新秩序的前沿课题之一。 作者:史安斌(清华大学新闻与传播学院副院长,教育部青年长江学者特聘教授)、龙亦凡(清华大学新闻与传播学院硕士研究生) |