智能文本生成:进展与挑战( 三 )


在智能文本生成技术的应用过程中,需要甄别真需求,避免伪需求 。真需求即高频率的写作需求,伪需求则是低频率的写作需求 。某些场景下年均只需要撰写少数几篇稿件,这种写作需求并不需要采用智能文本生成技术来应对,因为智能写作系统带来的效益会低于开发智能写作系统的投入 。在甄别出真实的智能写作需求之后,智能写作系统的开发方通常需要与应用方进行深入沟通和合作,因为智能写作系统的成功离不开应用方的数据和经验 。此外,目前智能写作的技术水平与若干智能写作应用需求之间存在较大的差距,也就是说,目前的智能文本生成技术无法满足若干复杂的智能写作需求,例如,自动撰写爆款网络小说、自动撰写长篇科普文章等 。
2 智能文本生成的主要方式
从文本生成输入和输出之间的关系出发,本文将智能文本生成的主要实现方式归为以下3类(对话生成(包括闲聊型、任务完成型)也属于智能文本生成范畴,但因其自身已形成一个相对独立且活跃的研究领域,因篇幅有限,本文不再列入及阐述 。) 。
其一,基于文本扩写的智能文本生成 。文本扩写即文本从无到有,或者从少到多,该方式以非文本信息或少量文字信息为输入进行文本生成 。基于数据的文本生成()、基于AMR的文本生成()、基于视觉的文本生成(,主要包括图像描述生成和视频描述生成)、故事/作文生成(基于标题或关键词的篇章生成)等属于文本扩写方式 。该方式的特点是输出文本中的大量或全部文字需要由算法模型进行补充或创作 。
其二,基于文本缩写的智能文本生成 。文本缩写即文本从多变少,该方式对输入的文本内容进行浓缩和提炼,并输出相对较短的文本,主要包括文本摘要生成、标题生成、综述生成等任务 。该方式的特点是与输出文本相比,输入文本通常包含更多的信息,因此需要算法模型进行信息的重要性评估和筛选,使输出文本尽可能包含输入文本中的重要内容,同时舍弃边缘内容 。

智能文本生成:进展与挑战

文章插图
其三,基于文本改写的智能文本生成 。文本改写即对文本进行改变以达到特定目标,输出文本与输入文本的长度相差不会很大 。属于该方式的文本生成任务主要包括文本复述、文本简化、文本风格迁移等 。该方式的特点为输出文本与输入文本通常可以进行词汇短语级别的对齐,可看作单语言机器翻译问题 。
图1总结了3类主要智能文本生成方式及涵盖的典型文本生成任务 。上述3类智能文本生成方式可独立应用于智能写作系统,也可进行组合,实现更加复杂的机器写作目标 。例如,可以结合扩写与缩写两种方式进行财经类新闻的自动生成 。具体来说,可基于技术针对财经类数据进行描述生成,然后基于文本摘要技术总结专家观点,将两者结合在一起,形成同时包含基本财经信息和专家观点的财经新闻,更好地服务读者 。
图1 智能文本生成主要方式以及典型文本生成任务
3 基于深度学习的智能文本生成
3.1文本生成方法概述
早期的文本生成方法主要基于规则,并且采用流水线框架,将复杂的文本生成任务分解为多个阶段,对每个阶段分别进行设计和求解 。其优点是不依赖大规模标注数据,可解释性较好,错误容易诊断和定位;缺点是过于依赖专家知识,领域迁移性差,流水线框架也会带来错误累积 。例如,对于任务而言,英国阿伯丁大学的 E提出了基于流水线的生成框架,包括信号分析( )、数据阐释(data )、文档规划( )、微规划与实现( and )4个阶段,并可以进一步将该框架简化为数据分析、文档规划、语句实现3个阶段 。其中数据分析的目的为对输入数据进行分析理解,获取高层消息以及消息之间的关系;文档规划的目的为分析决定哪些消息和关系需要在文本中被提及,同时确定文本的整体结构、输出需要提及的消息及文档结构;语句实现的目的为基于选中的消息及结构进行句子规划及实现,要求最终实现的句子具有正确的语法、形态和拼写,同时采用准确的指代表达 。上述框架中的每个阶段都可以考虑基于规则实现,对于语句实现可考虑利用文法信息 。随着标注数据的积累和增多,业界逐步采用统计方法进行文本生成 。考虑到文本生成与机器翻译的相似性(将输入信息翻译/转换为特定自然语言表达),不少研究者尝试复用机器翻译模型来完成文本生成 。需要说明的是,不同文本生成任务具有不同的特点,因此不同文本生成任务的阶段分解、规则设计及适用的统计方法不尽相同,需要有针对性地考虑 。