智能文本生成:进展与挑战( 二 )


媒体出版是智能文本生成最重要和最典型的应用领域 。首先,许多传统媒体单位(如报社)逐步采用智能文本生成技术进行新闻稿件的自动或辅助创作,主要面向结构和表达相对简单的天气预报、赛事简讯、财经简讯等新闻类型,同时为新闻自动生成标题、摘要等,方便读者快速浏览新闻内容 。例如,美联社自2014年7月开始采用新闻写作软件自动撰写新闻稿件报道公司业绩,大大降低了采访人员的工作量 。2019年,笔者与科学网进行了面向科技新闻类型文本生成的全新尝试与合作,研制推出了小柯写作机器人 。小柯是一个跨语言科技新闻生成系统,能够基于机器翻译和文本摘要技术自动根据英文学术论文生成简短的中文科技新闻 。目前小柯机器人已覆盖物理科学、地球科学、生命科学、化学科学4个学科,撰写科技新闻1万多篇,总阅读量超过1 000万次 。考虑到科学网的专业性和严肃性,所有自动生成的稿件在发布前均需编辑进行人工审核 。其次,互联网上出现越来越多的新媒体平台,为广大网民提供新闻资讯服务,这类平台通常采用信息推荐技术将不同话题的新闻推荐给不同用户,从而增强用户对平台的黏性和忠诚度,提高平台流量 。由于新媒体平台的用户数量庞大,用户感兴趣的话题也不尽相同,因此对新闻稿件的需求量也会很大,采用人工编辑撰写新闻的传统方式已无法满足用户需求,亟须采用智能文本生成技术批量生产大量新闻稿件并进行分发 。
可以看到,目前很多新媒体、自媒体平台上均有大量新闻由算法生成,覆盖民生、娱乐、体育、财经、社会等各领域 。考虑到新媒体用户对新闻质量的容忍度较高,自动生成的新闻通常不需要人工审核即可发布 。例如, 2016年里约热内卢奥运会期间,笔者与字节跳动合作研制了小明写作机器人,该款机器人主要撰写体育赛事新闻(小明机器人的写稿类型后续进一步拓展到财经新闻,并且覆盖10多种语言 。),是业界首款既能创作简讯又能创作长篇报道的写作机器人 。其中体育赛事简讯基于体育赛事数据自动生成,长篇报道则基于体育直播文字进行智能筛选与组合而成 。小明机器人撰写的体育新闻自动发布到今日头条平台,服务亿万用户 。此外,部分出版社尝试利用智能文本生成技术进行书籍的自动编写,目前主要用于编写与科技进展介绍相关的书籍 。例如,2019年施普林格出版社与德国法兰克福大学合作,开发算法自动编写了一本介绍锂离子电池最新研究进展的书籍,该算法主要对该学科大量现有的学术论文进行聚类和摘要自动生成 。智能文本生成技术能够驱动媒体出版行业的流程变革,节约人力和成本,而随着智能文本生成技术的快速发展,写作机器人将有能力撰写结构更复杂、更有深度的新闻稿件,进一步扩大应用范围 。
电子商务是智能文本生成另一个应用比较成熟的领域 。首先,主流电商网站(如京东、淘宝)会定期上线大量的全新商品,这些商品通常需要对应的标题及描述,从而方便用户浏览和购买 。考虑到商品数量巨大,人工撰写的成本会很高,而且效率低下,因此主流电商网站通常会采用智能文本生成技术基于商品的基本参数进行商品标题和描述的自动撰写 。目前电商网站上的商品标题和描述大多是通过算法自动生成的,一般具有较高的质量 。其次,电商网站为了应对用户在购物、售后等方面的交流需求,通常会部署智能客服系统回复用户的问题 。智能客服系统需要精准理解用户意图,并利用文本生成技术生成相应的回复文本 。同时,部分电商网站会基于对话摘要技术对客服与用户的对话交流进行总结,生成简短的摘要 。最后,为了对商品和服务进行推广和营销,很多商家会采用智能文本生成技术自动为商品生成广告和营销类文本,然后发布到众多媒体平台,吸引用户的注意,从而提升商品销量 。可以看到,智能文本生成技术已渗透、应用到电子商务的众多流程环节,成为电子商务发展的助推器 。