AI 挑战记者和作家,内容生产不再是人的专利

管理员账号

2018-06-07

各种文字、影像等内容的生产,一直被认为是需要创造性的、很难被机器替代的工作。事实上,用机器进行内容生产的研究从很早就开始出现,并正在持续进行,只不过一直未能取得很好的效果。近年来,以深度学习、强化学习、迁移学习为代表的人工智能技术,在文本处理、音频处理和图像处理等方面持续取得突破性进展,为机器从事内容生产拉开了序幕。

文本类内容,如诗歌、小说、新闻稿、散文等,是日常生活中最基本的内容形式。围绕文本类内容的生产,诞生了记者、作家、编剧等职业。近两年来,AI 开始逐渐参与文本类内容的创作,其创作出的部分内容,已难以分辨是由人还是由机器所创作。

AI 在文本内容生产中的应用主要包括写诗、编剧、写小说、写新闻、编程、辅助内容创作等。AI 写新闻稿已经在头部媒体中投入实际应用,具体用于个别题材的新闻生产,所生产的内容在全部媒体内容中的占比还很小。AI 在剧本结果预测、前期素材搜集、文本纠错等方面也已经得到应用,未来可能被整合到各种文本编辑器和工具之中。AI 在作诗、编剧等方面也都取得了一些进展,但目前均处于尝试研究阶段。

一、AI 写诗

如今,AI 已经能够自动生成古典诗和现代诗,典型代表有微软小冰、编诗姬、清华薇薇等。微软小冰创作的是现代诗,于2017 年5 月出版了诗集《阳光失了玻璃窗》。

下面是《阳光失了玻璃窗》的内容节选:

向着城市的灯守着我

咬破了冷静的思想

你的眼睛里闪动

无人知道的地方

编诗姬和清华薇薇创作的是古典诗,编诗姬可以随机作诗,或根据指定词生成藏头诗,薇薇由清华大学语言与信息中心研发,曾与人进行作诗比赛,但作出的诗并不如人类。下面是薇薇的作品《海棠花》的内容节选:

红霞淡艳媚妆水,

万朵千峰映碧垂。

一夜东风吹雨过,

满城春色在天辉。

编诗姬创作的藏头诗如下。

二、AI 编剧

AI 在编剧和小说写作方面已经有了一些尝试。但完全由AI 编出的剧本还存在语句不通的问题,目前AI 主要和人协作进行编剧,集中于科幻和恐怖两大类型。AI 写小说目前也都是在人的协助下完成的,一篇由AI 参与创作的小说在日本参加文学比赛通过了初审。

完全由AI 编剧的尝试,来自2017 年纽约大学的一位研究者与一位导演的实验项目。在该实验项目中,AI 在学习了各种经典剧本之后,自动写出了一个科幻剧本。导演将该剧本拍成了一部9 分钟的电影SUNSPRING,并参加了伦敦电影节48 小时短片挑战赛。该剧本中的单个句子是通顺的,但句子之间逻辑混乱,还无法达到剧本的基本要求。下图 展示了电影SUNSPRING 的开头画面。

目前,AI 进行剧本和小说创作,需要与人类协作完成,人机协作的方式主要有:第一,机器提供编剧建议;第二,人类创作主线,机器填充内容;第三,机器生成初稿,人类进行修改;第四,人机接龙。下面我们一一进行介绍。

AI 能够根据过往电影数据,为编剧提供方向性的建议,典型的案例是在Kickstarter 上众筹的视频项目《不可能的事》。在电影创作过程中,AI 建议在电影中融入“鬼魂”和“家庭关系”两种元素,如此能够提高收视率,并建议预告片中加入“钢琴”和“浴缸”的场景。制作方采纳了AI 的建议,完成了预告片的制作。视频《不可能的事》预告片画面如下。

AI 能够根据人类创作的主线,自动填充内容完成写作。在日本公立函馆未来大学的一项研究中,研究者事先设定好人物角色、内容大纲等内容,之后由AI 根据这些内容框架填充成完整小说,完成了《电脑写小说的那一天》等两部作品。

《电脑写小说的那一天》节选:

那天,云层低垂,闷得让人透不过气。但房间里却十分舒适。洋子穿着宽松的衣服,坐在沙发上,打着无聊的游戏打发时间,没有和我讲话……

这是人生中第一次,我如此既喜又悲,忘情地写作。计算机写小说的这一天终于来了。电脑可以优先追求属于自己的欢愉,再也不用为人类服务。

人机接龙是另一种AI 写作方式。日本东京大学的一项研究采用了“人狼智能”,即在人和AI 之间玩“狼人游戏”,然后选出有趣的故事情节,再由人类改编成小说,完成了《你是AI TYPE-S》等两部作品。类似的案例还有MIT的一项研究项目,Twitter 机器人Shelly 同样是通过与网友玩“故事接龙”的形式进行学习,改进写作能力,创作恐怖故事。下图展示的是MIT 编剧机器人Shelley。(来源:电子发烧友网《麻省理工学院打造人工智能应用Shelley写小说》)

Shelley 最初独自创作的《婴儿》节选:

当我再次听到电话铃声时,我跑到楼梯上。当我跑下楼梯的时候,我开始听到哭声。走到楼梯的角落时我打开手机的闪光灯,看到那个正在啼哭的婴儿越来越近了。我爬到他的前面,使劲地踢他。结果,楼梯上的哭声,变成了一种柔和的金属声。

三、AI 写新闻

新闻对写作速度的要求较高,机器写作显然比人类快很多,因此国内外多家媒体一直在进行机器写稿的研究。AI 的发展为此提供了可能,越来越多的主流媒体开始应用机器人写稿。此前,机器只能处理财经、体育、地震等内容结构相对固定领域的新闻。如今,机器写稿也开始被应用于民生、科技等领域。

部分媒体应用写稿机器人的情况如下。

与人类写稿相比,机器的优点在于速度远快于人类、数字出错的概率低。

但目前机器所写的稿件也存在千篇一律、模板化痕迹重、仅仅对信息重新排列组合、信息理解深度不足、缺乏提炼和概括能力、缺乏自主观点、语言中性化、缺少重点与变化、存在信息出错的可能等诸多问题。

上图为南都机器人小南撰写的新闻网页截图。

四、AI 辅助写作

除了内容创作以外,AI 还可以通过收集素材、纠错等方式,在写作前的素材准备和写作后的检查环节为人类提供辅助。辅助写作同样能够提高内容生产效率,与机器直接写作相比技术难度较小,可能会更早地投入实际应用之中。

AI 能够辅助新闻工作者收集素材。机器通过在网络中对指定关键词进行扫描,筛选出相关文章或图片,进行核实后再分类打标签,发送给记者,由此保证记者不会错过重要新闻,也为记者快速撰稿提供了素材。体育媒体GiveMeSport 就用机器扫描Twitter 上有关球星、球队的新闻内容,根据新闻重要性打标签,整合后推荐给记者。比如百度百家号的语音纠错功能。

AI 能够辅助语句纠错。2017 年6 月,百度百家号平台上线了“语义纠错”功能,该功能通过对作者在百家号上创作的文章正文进行快速校对,帮助作者识别和更正内容中的错别字,准确率达到75%。百家号此次上线的AI 智能语义纠错功能,能够结合上下文理解词语,找出不符合语义的错别字。例如“通过锻炼,回复效果比较好”这句话,错别字纠错功能识别不出错别字,但语义纠错就会提示“回复”应修改为“恢复”。

除上述内容之外,AI 能进行个性化内容的撰写。《华盛顿邮报》研发的Own,能够根据读者在网站上的浏览行为,为读者推送机器写好的定制化欢迎信息和广告,提升内容被阅读或观看的概率。在芝加哥大学的一项研究中,研究者将Yelp 平台上的数百万条评价用于模型训练,得到了一个能写出以假乱真的商家好评的神经网络模型。

一段时间内,AI 或许能在少数领域完全替代初级内容创作者,在更多领域仍会作为辅助人的工具被应用,很可能是以各种内容生成工具的新功能的形式出现。就像机器能画出龙的身躯,但要让龙栩栩如生,还是需要人来点睛的,机器能够替代人完成内容创作的大量工作,但内容创作的核心理念、思路、精髓,仍需要人来把控。

毕竟,内容以人为本,最终是给人看的

读者评论

相关专题

相关博文

  • 机器学习算法实现解析——word2vec源码解析

    机器学习算法实现解析——word2vec源码解析

    赵志勇 2017-05-23

    在阅读本文之前,建议首先阅读“简单易学的机器学习算法——word2vec的算法原理”(目前还没发布),掌握如下的几个概念: 什么是统计语言模型 神经概率语言模型的网络结构 CBOW模型和Skip-gram模型的网络结构 Hierar...

    赵志勇 2017-05-23
    599 0 0 0
  • 深度学习第一天“基本概念”

    深度学习第一天“基本概念”

    款热的AI患者 2017-05-07

    人工智能,机器学习,深度学习 人工智能范围宽泛,机器学习是实现人工智能的一种手段,深度学习是人工智能的一个分支。 深度学习发展史 目前深度学习,基本上是神经网络的代名词。 神经网络发展史基本分为三个阶段 第一阶段类似于仿生(McCul...

    款热的AI患者 2017-05-07
    146 1 0 0
  • 初识视觉SLAM:用相机解决定位和建图问题

    初识视觉SLAM:用相机解决定位和建图问题

    管理员账号 2017-05-04

    小编说:视觉SLAM 是指用相机解决定位和建图问题。本文以一个小机器人为例形象地介绍了视觉SLAM的功能及特点。 SLAM 是Simultaneous Localization and Mapping 的缩写,中文译作“同时定位与...

    管理员账号 2017-05-04
    935 0 0 0