从不及格到榜首！ ChatGPT拿下东大京大状元全面超越人类最高分-致富财经

日本AI新创LifePrompt于4月27日公布一项引发关注的测试结果，显示ChatGPT在模拟作答2026年东京大学与京都大学入学考试时，总分全面超越人类考生最高分，甚至在最难的理科考试中领先约50分，凸显生成式AI能力正以惊人速度进化，对教育制度与人才评量带来冲击。

此次测试采用OpenAI最新模型「ChatGPT-5.2 Thinking」，以影像形式输入试题，并涵盖论述题等复杂题型，最终由补教机构讲师人工评分，并结合大学入学共通测验成绩计算总分，使结果更贴近真实考试情境。

根据公布数据，AI 在两校主要科系中均取得压倒性优势，整体成绩如下：

项目	ChatGPT 成绩	人类最高分	差距
东大文科一至三类	452 分	434 分	+18 分
东大理科一至三类	503 分	453 分	+50 分
京大法学系	771 分	734 分	+37 分
京大医学系医学科	1176 分	1098 分	+78 分

从细项来看，AI 在标准化与逻辑导向科目表现突出，但在论述题仍有明显差距：

参与评分的讲师指出，AI在解题逻辑上「相当完整」，但部分论述仍欠缺人类观点的细腻性与深度。

值得注意的是，这项成果建立在极短时间的技术跃进之上。 LifePrompt 指出，2024 年使用当时模型测试时，ChatGPT 在东大考试中「全科未及格」; 2025年采用新一代模型后首次达到及格水平; 2026年则直接跃居第一名。

对此，LifePrompt负责人远藤聪志表示：「AI 的聪颖得到了充分展现，其进化速度飞快。」他并指出：「企业在导入 AI 时，应着眼于 10 年、20 年后的业务形态。」

此次测试结果也与全球 AI 发展趋势相呼应。随着大型语言模型持续升级，AI已从过去的辅助工具，逐步转向可执行高阶认知任务的系统，甚至在标准化考试中超越人类顶尖群体。分析人士认为，这不仅对教育制度构成挑战，也可能改变未来人才评量方式。

教育界普遍认为，传统以解题能力为核心的考试模式正面临压力，未来可能需更强调创造力、批判思考与跨领域整合能力。同时，人机协作能力也可能成为新的关键指标。

随着 AI 能力持续突破，类似情况预料将不仅限于考试场域，医疗、法律与金融分析等专业领域亦可能出现 AI 与人类直接竞争的局面。观察指出，这次ChatGPT在东大与京大考试中的表现，可能只是AI全面进入高知识密集领域的开端。

网站首页