2023年9月,吉林外国语大学“语言大数据处理与应用实验室”获批吉林省高校哲学社会科学实验室。
目标定位:
实验室充分发挥语言学和人工智能等学科的优势,深入研究大数据技术、深度学习等人工智能技术在语料库建设和翻译技术中的应用,研发人工智能与语料库高度融合的创新性技术,解决该领域 中的核心问题;利用实验室平台开展多语种语料库的采集、标注、处理和分析等工作,开展语 言大数据驱动的语言研究、翻译研究、智慧教育和人工智能等领域的研究,提升基于语言数据 的教学与科研能力。
主要研究方向:
1.语料库建设与应用研究。通过研发语料库建设与应用工具以及语言大数据处理与应用产品。在语料库建设阶段,针对语料采集、加工、标注、存储等各个环节,研发基于语言大数据处理的软件与工具。在语料库应用阶段,利用机 器学习算法和自然语言处理技术,构建出特定主题或领域的语料库,提高语料库的构建效率。
2.语言大数据与翻译技术研究。通过引入系统论,将翻译活动和翻译技术置于系统视野中,借助大数据技术赋能 翻译活动全过程,聚焦平行语料采集、对齐、分词、分句、词形还原、文本分析等核心问题, 为翻译技术面临的现实问题提供解决方案。帮助优化翻译过程各环节,尤其是机器翻译和语言 大模型接入计算机辅助翻译系统、译文润色等环节。
3.语言大数据与语言教育研究。结合大数据、人工智能的交叉学科属性与规律,结合我校多语种教学、国际中文教 育等专业特色,开展自适应学习、智能辅助教学、自动评估与反馈和数据驱动的语言研究等领 域的研究,推动语言大数据在教学中应用研究,促进语言教学与研究。