作者:朱汉斌 来源:中国科学报 发布时间:2024/11/17 16:54:13
选择字号:
粤语语料库建设与大模型评测重点实验室成立

 

11月14日,大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会在广州大学(黄埔校区)举行。

记者获悉,粤语语料库建设与大模型评测重点实验室将围绕粤语文化精神标识体系研究、通用粤语语料库建设、大模型粤语言语交互质量评测、大模型粤语言语交互质量提升研究四个方向开展科学研究。该实验室设立“双首席科学家”。由中国工程院院士、广州大学网络空间安全学院名誉院长方滨兴,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵担任实验室首席科学家。

启动现场。广州大学供图

  ?

“粤语作为中华文化的瑰宝,承载着粤港澳大湾区深厚的历史文化底蕴。我们有责任,也有义务,利用现代科技手段,保护和传承好这一宝贵的文化遗产。”广州大学张其学副校长指出,粤语语料库建设与大模型评测重点实验室的成立,是学校服务国家战略、响应时代号召的具体行动,也是学校在跨学科建设中迈出的重要一步。该实验室不仅能推动粤语文化的数字化传承,更能在粤港澳大湾区乃至全球的文化交流与合作中发挥积极作用,还将成为学校跨学科发展中的重要学术平台。

据介绍,粤语语料库建设与大模型评测重点实验室采取1+1+N的运行机制,由广州大学和广州市社会科学界联合会联合共建,采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。该实验室第一期建设周期为5年,长远目标是成为立足粤港澳大湾区、面向国家语言服务战略、通用粤语语料库及大模型粤语服务评测的国内乃至全球首屈一指的科研与对外服务专业学术性机构。

“当语言遇到大模型,每个国家,每个语种,要重新审视自己的文化语言战略。”广州大学教授、粤语语料库建设与大模型评测重点实验室主任齐佳音表示,实验室将通过建立岭南文化核心语料及细分领域知识库、粤语数据资产库、粤语高质量数据集,以该实验室为载体形成面向人工智能应用的粤语文化数据资源基础服务能力以及面向人工智能粤语服务的内容安全合规评测能力,为粤语的数据化、资源化、服务化和产业化助力。

方滨兴作报告。广州大学供图

  ?

研讨会上,方滨兴以《大模型保险箍:大模型护栏的一种模式》为主题作主旨报告,介绍了当前大模型安全合规风险与挑战、多文化背景下的全球企业大模型安全监管创新应用,指出多文化背景下大模型内部价值对齐的难点以及大模型安全护栏的必要性,重点分享了其团队提出的大模型安全合规的保险箍模式的实践与持续研发情况,并对我国大模型安全未来监管提出了建议。

记者了解到,粤语语料库建设与大模型评测重点实验室以广州大学为主体,依托广州大学网络空间安全学院、人文学院、新闻与传播学院,打造跨学科协同创新科研平台。该实验室以广州为基地,推动广东、香港、澳门的学术团体以及互联网企业,共建共享粤语语料数据库。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学家完整构建火星空间太阳高能粒子能谱 “糖刹车”基因破除番茄产量与品质悖论
备受科技巨头青睐 下一代地热来了 变暖加速喜马拉雅高山树线向高海拔扩张
>>更多
 
一周新闻排行
 
编辑部推荐博文