写意中国·说文解“字”丨用大数据破译汉字密码让“冷门绝学”热起来 中国之最wod

大河网讯 大家都听说过甲骨文,但认识甲骨文吗?甲骨文有多少个?都长什么样子?甲骨文作为古文字,离普通大众距离较远,对甲骨文的活化利用是我们当前需要研究解决的一个大课题 。
2019年,安阳师范学院计算机与信息工程学院教师刘永革带领团队研发的世界第一款免费甲骨文大数据平台“殷契文渊”惊艳亮相,一下拉近了甲骨文与普通大众的距离 。
3000年前的文字,计算机将如何读懂?甲骨文“撞上”现代科技,如何让“冷门”不冷?如何以大众喜闻乐见的形式展示甲骨文的魅力?
沉睡3000年的甲骨文急需“唤醒”
“2000年,当时回到学校,两位研究甲骨文的老师力主我开展甲骨文信息化研究,而我对甲骨文的认识等同于空白 。”作为出身数学专业的本科生和计算机软件硕士刚毕业的刘永革,自那一刻起,笃定了将甲骨文信息化研究作为一生奋斗的事业 。
谈起自己的研究工作,刘永革开玩笑用“两头堵”来形容,他说:“一头是中国最古老的文明甲骨文,另外一头是先进的计算机技术、人工智能 。”
甲骨文发现于今安阳市西北五里小屯村北面,距今3000多年,这种远古文字,也因年代久远而充满神秘和未知,破解甲骨文成了世界难题,而要破解还有一个难题摆在面前——我们没有办法把甲骨文输入到电脑 。
“因为甲骨文和汉字不一样,它好多字我们不认识,所以说你用拼音输入法不行,还有一些字像一幅画一样,那么也不能用部首,也不能拆分,此前甲骨文输入法采用编码输入,记忆负担和学习成本较大 。”刘永革说 。
刘永革称,之前不管是写论文、讲课,还是做研究等,所有场合使用都需要用图片粘贴,研制甲骨文输入法,建立字库,让任何人使用都可以轻松输入至关重要 。
“用计算机技术研究甲骨文的编码、字库、输入法、数据库建设,为甲骨文专家提供一些工具,辅助甲骨文研究,是我和团队的主要任务 。”
“殷契文渊”让甲骨文瞬间“活起来”
为了学习最新的研究成果,让思想不落伍,每当有甲骨文研究专家到安阳,刘永革和团队成员一定积极请教;甲骨文学术研究会议,时间再紧也要参加……
随着了解得越来越深入,刘永革发现,我们民族最古老的文字,因为晦涩难懂和研究资料较少,与现实技术不兼容,导致研究效率低下 。
如何让甲骨文的研究信息共享,让全人类资源互通,群力群策一起研究呢?刘永革决定利用自己的专业,为甲骨文的发展绘制蓝图 。
于是一个汇集甲骨文信息的“殷契文渊”项目悄然启动,这个项目就是在互联网上为世界提供甲骨文的全部信息,让全世界人民了解甲骨文、认识甲骨文、研究甲骨文 。2019年,由刘永革团队用8年时间精心打造的世界第一款免费甲骨文数据库 “殷契文渊”惊艳亮相 。
“比如说,某个字不认识,就可以登录我们的殷契文渊,通过点击部首,与这个字相关的信息都可以查到,可以把这个字输入到文档里 。”刘永革举例说 。
从“殷契文渊”开放的第一天起,平台就对全世界用户提供免费服务,它里面现有152种著录,是目前最大的甲骨文数据库 。“它不仅服务全球的甲骨文、考古、历史、文字方面的研究专家,还吸引了古文字爱好者、中小学语文教师、书法爱好者等使用 。”
此前甲骨文资料很难查到,即使甲骨文专家也不可能拥有全部资料,“殷契文渊”项目建成后解决了这个问题 。
科技创新赋能破译甲骨“文明密码”
就在前一阵子,刘永革所在实验室和腾讯合作,共同开展人机协同助力甲骨文释读研究和传承活化,这个项目主要进行两方面工作 。