您当前的位置:首页 > 热点新闻

从不及格到榜首! ChatGPT拿下东大京大状元 全面超越人类最高分

日本AI新创LifePrompt于4月27日公布一项引发关注的测试结果,显示ChatGPT在模拟作答2026年东京大学与京都大学入学考试时,总分全面超越人类考生最高分,甚至在最难的理科考试中领先约50分,凸显生成式AI能力正以惊人速度进化,对教育制度与人才评量带来冲击。…

日本AI新创LifePrompt于4月27日公布一项引发关注的测试结果,显示ChatGPT在模拟作答2026年东京大学与京都大学入学考试时,总分全面超越人类考生最高分,甚至在最难的理科考试中领先约50分,凸显生成式AI能力正以惊人速度进化,对教育制度与人才评量带来冲击。

cover image of news article
(图:REUTERS/TPG)

此次测试采用OpenAI最新模型「ChatGPT-5.2 Thinking」,以影像形式输入试题,并涵盖论述题等复杂题型,最终由补教机构讲师人工评分,并结合大学入学共通测验成绩计算总分,使结果更贴近真实考试情境。

根据公布数据,AI 在两校主要科系中均取得压倒性优势,整体成绩如下:

项目 ChatGPT 成绩 人类最高分 差距
东大文科一至三类 452 分 434 分 +18 分
东大理科一至三类 503 分 453 分 +50 分
京大法学系 771 分 734 分 +37 分
京大医学系医学科 1176 分 1098 分 +78 分

从细项来看,AI 在标准化与逻辑导向科目表现突出,但在论述题仍有明显差距:

科目类型 表现
数学 满分
英语 约9成
世界史(论述) 约2成5

参与评分的讲师指出,AI在解题逻辑上「相当完整」,但部分论述仍欠缺人类观点的细腻性与深度。

值得注意的是,这项成果建立在极短时间的技术跃进之上。 LifePrompt 指出,2024 年使用当时模型测试时,ChatGPT 在东大考试中「全科未及格」; 2025年采用新一代模型后首次达到及格水平; 2026年则直接跃居第一名。

年份 模型表现
2024年 全科未及格
2025年 首次超过及格线
2026年 全面第一名

对此,LifePrompt负责人远藤聪志表示:「AI 的聪颖得到了充分展现,其进化速度飞快。」他并指出:「企业在导入 AI 时,应着眼于 10 年、20 年后的业务形态。」

此次测试结果也与全球 AI 发展趋势相呼应。 随着大型语言模型持续升级,AI已从过去的辅助工具,逐步转向可执行高阶认知任务的系统,甚至在标准化考试中超越人类顶尖群体。 分析人士认为,这不仅对教育制度构成挑战,也可能改变未来人才评量方式。

教育界普遍认为,传统以解题能力为核心的考试模式正面临压力,未来可能需更强调创造力、批判思考与跨领域整合能力。 同时,人机协作能力也可能成为新的关键指标。

随着 AI 能力持续突破,类似情况预料将不仅限于考试场域,医疗、法律与金融分析等专业领域亦可能出现 AI 与人类直接竞争的局面。 观察指出,这次ChatGPT在东大与京大考试中的表现,可能只是AI全面进入高知识密集领域的开端。

怕被外汇黑平台骗,推荐正规外汇平台:2026年正规外汇平台排名
标题:从不及格到榜首! ChatGPT拿下东大京大状元 全面超越人类最高分,收录于致富财经, 本文禁止任何商业性转载、分享,如需转载需联系小编并注明来源,部分内容整理自网络,如有侵权请联系删除。

免责声明

本网站所有刊登内容,以及所提供的信息资料,目的是为了更好地服务我们的访问者,本网站不保证所有信息、文本、图形、链接及其它项目的绝对准确性和完整性,网站没有任何盈利目的,故仅供访问者参照使用。本网站已尽力确保所有资料是准确、完整及最新的。就该资料的针对性、精确性以及特定用途的适合性而言,本网站不能作出最对应的方案。所以因依赖该资料所致的任何损失,本网均不负责。 除特别注明之服务条款外,其他一切因使用本站而引致的任何意外、疏忽、合约毁坏、隐秘汇漏、诽谤、版权或知识产权侵犯及其所造成的损失,本站概不负责,亦不承担任何法律责任。 如您(单位或个人)认为本网站某部分内容有侵权嫌疑,敬请立即通知我们,我们将在第一时间予以更改或删除。以上声明之解释权归致富财经网站所有。法律上有相关解释的,以中国法律之解释为基准。如有争议限在我方所在地司法部门解决。

为您推荐

返回顶部