2)探讨最优的稀疏度
为了探讨参数k的最优值,我们将k从10%变到90%,其结果如下:
我们发现,因为是一个相对较小的数据库,当k的值大于50%时,模型开始过拟合,并维持UA值不变 。而对于大规模的数据集LSSED,当k的值大于50%时,UA值因为噪声信息的引入而快速下降 。相反,当k小于50%时,由于模型使用到的信息太少,只能收敛到一个较差的局部点,性能也会变差 。因此,我们将k的值设置为50% 。
3)多模态交互分析
使用CCAB的数量代表不同模态之间的交互次数 。当CCAB的数量从0增加到3时,模型的性能逐步提升 。当数量为3时,模型取得了最好的性能 。这也说明模态之间进行多次交互的重要性 。
在人机协作的时代,人机情感交互变得尤为重要,也是科技社会人文关怀的重要体现 。未来,优必选科技与华南理工大学将持续在多模态情感计算、类人情感交互等类人情感智能的关键领域开展高水平合作研究,促成类人情感智能技术在机器人产业化中的应用,深入推动人工智能行业的发展 。
- 未完待续 ICASSP2020中语音合成部分论文阅读
- ICASSP2023审稿分数统计分析与转投会议推荐
- ICASSP 2023论文模型开源|语音分离Mossformer
- ICASSP 2014 Small
- ICASSP2023|达摩院语音实验室入选论文全况速览
- ICASSP2020:VVC基于线性模型的帧内预测模式
- ICASSP 2022丨希尔贝壳1篇论文被录用
- ICASSP2023论文分享 | DST:基于Transformer的可变形语音
- 2022年苹果WWDC定于6月开办,全家桶软件系统均计划升级
- 把苹果全家桶用于VR全身追踪是什么体验