哈工大赛尔实验室开源“巧板”儿童情感陪伴大模型

1. 背景
儿童的心理健康在其个人成长和发展中扮演着极其重要的角色,直接影响着他们的学习表现、人际交往能力和未来成长 。一个充满支持和关爱的家庭环境在促进儿童情感发展方面起到至关重要的作用,被忽视和缺乏陪伴的童年势必不利于儿童的心理健康成长,而这正是当代诸多儿童成长中时常面对的问题 。
为了守护儿童的心理健康,促进他们茁壮成长,我们决定开发儿童情感陪伴场景的对话系统,主要面向K12中小学生及家长群体 。近来,大语言模型(LLMs)在对话生成方面取得了令人惊艳的突破,但将其直接应用于儿童心理健康和情感发展领域仍面临挑战 。因此,我们积极探索将大模型迁移到儿童情感对话领域,研发出适用于儿童情感陪伴的大模型——“巧板”,真正成为他们的情感陪伴助手,为他们的心理健康保驾护航 。
“巧板”大模型与儿童情感陪伴能力比对 。存在回复冗长,情感陪伴方式模板化的问题 。2. “巧板”大模型
“巧板”大模型是一个开源7B规模的中文儿童情感陪伴大模型 。“巧板”指七巧板,是一款承载着中国传统智慧的益智拼图玩具,更是一款教育益智工具 。这次发布的儿童大模型正是希望通过陪伴、益智和教育功能,与儿童们建立更深厚的情感纽带 。此外,为符合SCIR实验室发布大模型命名规范,故命名为“巧板”大模型 。而这个特别的名称也蕴含着我们对儿童成长的悉心呵护,就像巧板一样,为他们拼出美好未来提供帮助 。
“巧板”大模型独具三大特点:
儿童心理学理论指导 。基于情绪辅导理论的儿童情感陪伴对话数据构建,更有效地守护孩子的心理健康 。
高质量的儿童对话数据构建 。高质量对话数据由具有儿童心理学背景的志愿者与专家参与完成,确保数据的真实性与有效性 。
温暖的儿童陪伴体验 。与儿童的交互方式更加贴心,能够真正与他们建立深入的情感连接,让儿童感受到温暖和认同,成为他们坚实成长道路上的得力伙伴 。
3. 方法
我们基于开源通用大模型,使用通用域人机对话、单轮指令数据以及儿童情感陪伴对话数据进行指令微调 。其中,儿童情感陪伴对话数据的构建过程受儿童情绪辅导理论启发,以指导我们正确有效地对儿童的情绪进行管理与指导 。训练代码、所使用的部分儿童情感陪伴对话数据等相关信息已发布至仓库:
儿童情感陪伴对话数据构建 儿童情绪辅导理论儿童情绪辅导理论为应对儿童日常情绪经历提供了有力的理论支持,引导父母认识并尊重孩子的情绪,与之产生共鸣,并站在孩子的角度上,提供支持性建议,助其解决情绪困扰 。这一理论已被广泛视为促进儿童情绪发展和解决心理健康问题的有效育儿方法 。具体而言,当儿童面对强烈情绪时,父母应采取一系列特定策略来支持孩子的情绪成长 。这些策略包括:情绪觉察,即敏锐察觉孩子的情感;情绪认可,即肯定孩子的情绪体验;情绪标注,即帮助孩子表达情感;表达共情,即表现出对孩子感受的理解;以及提供支持,确保孩子得到所需的支持和关怀 。数据获取我们从真实场景的儿童对话话题列表中进行采样,选定当前对话话题,在儿童情绪辅导理论的指导下,构建了1k余段高质量中文儿童情感陪伴对话数据 。数据构建过程由经过儿童情绪辅导理论培训的志愿者完成,同时我们邀请了儿童心理学领域的专家学者对数据的收集过程提出建议与指导,以确保数据的准确性和可信度 。
此外,我们通过话题采样选定当前对话话题,结合儿童情绪辅导理论指导下的,共同组成,从gpt-3.5-turbo中获取5千段儿童情感陪伴对话数据 。