2025年3月26日在中国社会科学院民族学与人类学研究所召开了由徐世璇研究员担任首席专家的国家社科基金综合类重大招标项目“数位典藏理论探讨和软件平台建设及其语言实践研究”结项评审会。会议由中国社会科学院科研局项目处闫珺处长主持,来自高校的五位评审专家分别于线下线上参加了会议。民族学与人类学研究所党委书记赵天晓、主持所务工作的丁赛副所长出席会议,参加会议的还有科研处王小霞处长、语言学科片各研究室主任及同仁和课题组成员,共20余人。
首先,课题主持人徐世璇研究员对课题执行情况、课题特点、最终成果及其创新等做了全面汇报。子课题负责人于重重教授对计算机及AI技术在课题中的研究与应用作了专题陈述。课题组还简要介绍和演示了典藏库的线上形式、关于语言及其社会文化的影视片和由专用软件Elan合成的多模态语料。
这一重大课题是一项跨学科、多专业的综合性、原创性研究,课题的最终成果分别为一部30万字左右的专著和一个三种语言的多模态语言典藏库。专著对本世纪形成和发展起来的语言典藏这一新领域的实践经验、理论建构、方法创新进行全面的分析和论述,试图以我国的语言特点和典藏实践促进语言典藏理论和方法论的建设,推进相关研究的深入发展。多模态语言典藏库建立在对土家语、吕苏语、水语进行田野调查所获取的全新语料的基础上,以长篇自然话语为主体,对所有的音像数据进行国际音标记音、语法标注、汉语逐词对译和逐句意译,并通过专用软件将音频、视频和标注翻译的文本进行三维合一,形成多层对应、同步显示的多模态语言资料,力求尽可能真实地记录原生态的自然语言。
评审专家仔细听取了课题总结汇报,对课题最终成果进行了认真的审议,就相关问题进行了提问。五位专家对课题成果给予一致肯定和较高评价,认为专著对调查采录原始语料和语言数据技术处理的理论、方法进行了系统化的论述,为语言典藏的普遍规律增加了富有中国特色的个案和例证,充实了典藏理论和方法的细节内涵。语言典藏库内容丰富,形式多样,较为全面地反映了原生态的语言面貌。课题的开展对多学科跨专业研究所作的卓有成效的实践探索,对于社会人文学科研究同计算机领域的深度结合具有重要意义。