在英国广播公司新闻BBC网站上你可以看到一些故事,标示是用“某种自动化”生成的。这些新闻故事是英国广播公司新闻实验室“自动新闻实验”的产物。
英国广播公司新闻实验室,希望在不大幅增加本地新闻团队工作量的情况下,为他们带来丰富的数据驱动的故事讲述。其目的是在有限的地方新闻人力物力的之上,能带来更多相关的本地新闻。
在过去的几个月里,英国广播公司合作开发了一个名为“半自动本地内容”的项目,即Salco(Semi-Automated Local Content) 。
在其中一个试验项目上,罗奥·赫顿和塔姆辛·格林两个开发人员组成的团队尝试每个月生成100多个独特故事,让观众每天都能在直播页面上了解当地医院在急救(Accident & Emergency)上的表现。
Salco将数据转化为故事的五步
Salco将数据处理、故事生成和编辑审批结合到一个简单的“点击”生成过程中。该过程获取原始数据,并根据记者设计的模板自动生成丰富的本地故事。
整个过程大约为5个步骤:
1、处理从英国国民保健系统得到的数据,并提取感兴趣的部分。
2、根据一名资深记者的模板,为每个国民保健机构制作一个文本故事。
3、为每个故事生成一个图形,以BBC的风格产生数据图形。
4、预览每个故事,这样记者就可以核实和批准它们。
5、将每个故事发布到适当的城市或地区的主题页面。
生成自然语言故事模板
将数据自动转换成散文被称为自然语言生成(NLG)。在这个项目中,BBC求助于阿里亚·NLG工作室,一个第三方工具,它允许记者生成将数据转换成新闻文章所需的复杂模板,然后在样本数据上进行测试,看看不同的输出故事的阅读效果如何。
这个工具允许一个迭代过程,在这个过程中记者可以通过增强模板看到故事是如何改进的。
生成BBC风格的图形
为了生成文章需要的图表和图像,自动新闻团队利用了英国广播公司为新闻故事添加数据可视化和其他图形的深度工具包(IDT)。
新闻实验室与维护IDT的数据展示团队合作,创建了一个系统,该系统将填充一个描述“数据”图形布局的模板,该模板强调故事中最有影响力的数字。
当最终的故事发布时,数据这将被渲染为图像。IDT深度工具包展现了可以利用现有的基础设施以新颖的方式自动生成模板图形。
记者审核和批准故事
最后,整个流程会在一个简单的出版界面列出了已经生成的故事,并允许它们发送到发布平台。记者能够检查系统所产生的报道的质量和准确性。
当一名记者检查后准备发表这些报道时,实验室会利用英国广播公司的“应用编程接口”,在适合该地区的直播流中生成报道草稿。
最终,负责监管该地区直播流的记者可以在报道到达时发布这些报道。
BBC新闻实验室表示,现在这个流程基本达到了原先的预期。在改进之后,一旦他们对这个流程系统 – Salco制作的报道质量建立了信心,这个过程将完全自动化。
声明:该文观点仅代表作者本人,加国头条 属于信息发布平台,加国头条 仅提供信息存储空间服务。
0 Comments