来源:Frontiers of Digital Education 发布时间:2025/8/19 16:10:32
选择字号:
FDE 论文解读 | 面向中文教育研究的开源大语言模型

论文标题:An Open-Source Large Language Model for Chinese Education Research

期刊:Frontiers of Digital Education

作者:Wentao Liu, Hao Hao, Aimin Zhou

发表时间:25 Jun 2025

DOI: 10.1007/s44366-025-0060-0

微信链接:点击此处阅读微信文章

当前开源大语言模型研究虽进展显著,但大多聚焦通用英语数据,且存在训练过程和数据集不透明的问题,而现有中文语料在规模和多样性上与英文差距大,导致大模型在中文任务中表现不佳,甚至出现中英文混合回答的情况,这为中文教育领域的大语言模型研究带来挑战。

研究论文

基于此,华东师范大学周爱民教授团队在Frontiers of Digital Education(《数字教育前沿(英文)》)期刊上发表了一篇题为An Open-Source Large Language Model for Chinese Education Research的文章,设计并开发了专门面向中文教育领域的大语言模型CELLM,所有模型、数据和代码均开源,旨在为中文教育领域的大语言模型研究提供参考基线。

在模型设计与开发方面,研究团队深入回顾与综合分析了Llama 3、Qwen2.5等五款具有代表性的开源大语言模型的源代码,对它们的核心技术和方法进行了详细比较。在此基础上,确定了CELLM的关键参数。

CELLM的训练过程包含预训练和指令微调两个阶段。预训练阶段,使用了专为教育领域自然语言处理任务设计优化的Chinese-fineweb-edu-v2数据集,其中中文数据占比75%,从该数据集中随机采样了33.6亿个 tokens 用于训练,耗时约106小时。指令微调阶段,团队开发并开源了包含超过25.8万条数据的中文指令数据集。为了获得这些数据,设计了多轮对话翻译框架,将英文指令微调数据高效转换为中文,还对翻译后的数据进行了清洗,最终得到的数据集用于进一步微调CELLM的性能,此阶段训练耗时约51小时。

 

图1 在翻译框架中使用的提示

在模型评估环节,研究人员在多个基准数据集上对CELLM进行了全面测试。结果显示,CELLM在人文社会科学领域表现较为出色,例如在C-Eval的社会科学和人文学科上的准确率超过26%,高于C-Eval的整体平均水平23.95%。但在STEM相关测试案例中表现相对较弱,像C-Eval-stem的准确率为21.48%。在编程能力评估的mbpp数据集上,CELLM的整体得分仅为0.6,表明其在编程任务上的表现有限。

研究首次提供了一个专为中文教育领域设计的开源大语言模型,填补了该领域的研究空白。其开源特性使得研究过程和数据具有高度透明度,有助于推动中文教育领域大语言模型的研究与发展。同时,研究中开发的多轮对话翻译框架等技术,也为相关领域的数据处理提供了有价值的参考。

不过,该研究也存在一定的局限性。由于预训练数据的质量和数量与其他一些模型存在显著差异,研究未将CELLM与其他有代表性的开源模型进行比较。未来,研究团队计划继续发布更全面的CELLM训练检查点以及对齐微调后的结果,以期在与类似参数规模的先进模型比较时能有更出色的表现。

文 章 信 息

Wentao Liu, Hao Hao, Aimin Zhou. An Open-Source Large Language Model for Chinese Education Research. Frontiers of Digital Education, 2025, 2(2): 23

https://doi.org/10.1007/s44366-025-0060-0

识别二维码,免费获取原文

作 者 信 息

刘文涛,华东师范大学智能教育专业博士、上海创智学院博士,主要研究方向包括长文本大模型、多模态大模型等,发表多篇CCF-A/SCI 1区论文,参与华东师范大学ChemGPT、Educhat等大模型研发工作。

郝昊,博士,毕业于华东师范大学计算机科学与技术学院,曾于上海交通大学自然科学研究院从事博士后研究,现为华东师范大学上海智能教育研究院专任副研究员。主要研究方向包括黑盒优化、代理模型设计和垂类大模型研究,在TEVC、SWARM、SCIS等国际顶级期刊和会议发表论文15余篇,申请发明专利2项。曾获国家自然科学基金青年项目、上海市“超级博士后”激励计划、博士后特别资助、博士后面上资助等多项科研资助。

周爱民,担任华东师范大学上海智能教育研究院院长。爱思唯尔2020-2022年度中国高被引学者。于2001年在武汉大学获得计算机学士学位、2003年在武汉大学获得计算机硕士学位、2009年在英国Essex大学获得计算机博士学位,2009年起在华东师范大学工作。主要研究领域包括演化优化与学习、可解释机器学习、智能教育、科学智能等。发表SCI一区/CCF A类期刊会议学术论文70余篇,相关成果谷歌学术累计引用1000余次。出版专著1本。申请或授权发明专利10余项。担任Swarm and Evolutionary Computation、Complex & Intelligent Systems、Chinese Journal of Electronics 等期刊副编或编委。参与创办演化计算与优化 (ECOLE) 研讨会并担任2016、2024年会议主席

往 期 回 顾

论文解读 | 王学男:DeepSeek的中国式创新重塑中国教育自信

论文解读 | 基于SOLO分类法的大语言模型驱动认知诊断

论文解读 | 陈静远等:利用人工智能知识调整大语言模型

视频推荐 | 浙江大学吴飞教授谈人工智能专业领域教育的垂类大模型

专家观点 | 刘革平:多模态大模型支持的教与学创新

期 刊 介 绍

期刊特点

1. 国际化投审稿平台Editorial Manager方便快捷。

2. 严格的同行评议(Peer Review)。

3. 免费语言润色,有力保障出版质量。

4. 不收取作者任何费用。

5. 不限文章长度。

6. 审稿周期:第一轮平均30天,投稿到录用平均60天。

7. 在线优先出版(CAP)。

8. 通过Springer Link平台面向全球推广。

在线浏览

https://journal.hep.com.cn/fde

(中国大陆免费下载)

https://link.springer.com/journal/44366

在线投稿

https://www.editorialmanager.com/fode/

邮发代号

80-164

联系我们

fde@hep.com.cn

010-58582344, 010-58581581

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
橡胶树育种路上的“石头”能数清了 人类胚胎着床过程的力学机制首次揭示
破解人脑独特性的关键DNA片段发现 NISAR卫星破纪录天线在太空“绽放”
>>更多
 
一周新闻排行
 
编辑部推荐博文