作者:许悦 来源:中国科学报 发布时间:2024/6/27 15:34:31
选择字号:
AI答题胜过真人

 

近日一项发表于《公共科学图书馆-综合》的研究发现94%的使用ChatGPT创建的大学考试答案,不会被检测出是由人工智能(AI)生成的,而且这些答案的得分往往比真实学生的更高。

如今,人工智能(AI)技术的兴起和发展,如ChatGPT的诞生,对教育部门提出了一个根本性问题,即学校许多形式的评估,都是在没有监考的情况下完成的,学生可能利用AI回答评估问题。尤其新冠疫情以来,对无监督的在家考试的依赖越发严重。如果学生使用AI作弊未被发现,那么这对整个评估方式都是个威胁。

为此,英国雷丁大学的Peter Scarfe和同事使用ChatGPT创建了雷丁大学心理学本科生学位5个模块共63个评估问题的答案。由于学生们是在家里参加这些考试的,所以他们可以查看笔记和参考资料,甚至可能违反规定,使用AI帮助答题。

AI生成的答案和真实学生的答案一起被提交筛查,其中前者平均占总答案数的5%。负责筛查并标记的人并不知道他们检查的答案中有来自33名假学生的。这些学生的名字也是由ChatGPT生成的。

在所有模块问题的答案中,只有6%的AI生成答案被标记为可能不是学生自己的答案。而有一些非AI生成的模块问题的答案则被标记存疑。

“尽管各模块之间存在一些差异,但平均而言,AI生成的答案得分比真实学生的更高。AI提交的材料中,得分超过学生的概率为83.4%。”Scarfe说,“但当前AI还难以进行更抽象的推理和信息集成。”

研究人员表示,他们的工作是迄今同类研究中规模最大、最有力的。尽管他们只研究了雷丁大学心理学本科学位的问题,但Scarfe认为这是值得整个学术界关注的问题。

“难保其他学科领域不会有同样的问题存在。”Scarfe说,然而从源头上解决这一问题几乎是不可能的。因此,必须重新考虑评估内容。

相关论文信息:https://doi.org/10.1371/journal.pone.0305354

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
跨能量尺度原子核结构研究获突破 我国地震工程领域首个国之重器通过验收
遗传分析追踪潘多森林的进化 团队研制出高性能的蓝光量子点液体激光
>>更多
 
一周新闻排行
 
编辑部推荐博文