日本AI新创LifePrompt于4月27日公布一项引发关注的测试结果,显示ChatGPT在模拟作答2026年东京大学与京都大学入学考试时,总分全面超越人类考生最高分,甚至在最难的理科考试中领先约50分,凸显生成式AI能力正以惊人速度进化,对教育制度与人才评量带来冲击。
此次测试采用OpenAI最新模型「ChatGPT-5.2 Thinking」,以影像形式输入试题,并涵盖论述题等复杂题型,最终由补教机构讲师人工评分,并结合大学入学共通测验成绩计算总分,使结果更贴近真实考试情境。
根据公布数据,AI 在两校主要科系中均取得压倒性优势,整体成绩如下:
| 项目 | ChatGPT 成绩 | 人类最高分 | 差距 |
|---|---|---|---|
| 东大文科一至三类 | 452 分 | 434 分 | +18 分 |
| 东大理科一至三类 | 503 分 | 453 分 | +50 分 |
| 京大法学系 | 771 分 | 734 分 | +37 分 |
| 京大医学系医学科 | 1176 分 | 1098 分 | +78 分 |
从细项来看,AI 在标准化与逻辑导向科目表现突出,但在论述题仍有明显差距:
| 科目类型 | 表现 |
|---|---|
| 数学 | 满分 |
| 英语 | 约9成 |
| 世界史(论述) | 约2成5 |
参与评分的讲师指出,AI在解题逻辑上「相当完整」,但部分论述仍欠缺人类观点的细腻性与深度。
值得注意的是,这项成果建立在极短时间的技术跃进之上。 LifePrompt 指出,2024 年使用当时模型测试时,ChatGPT 在东大考试中「全科未及格」; 2025年采用新一代模型后首次达到及格水平; 2026年则直接跃居第一名。
| 年份 | 模型表现 |
|---|---|
| 2024年 | 全科未及格 |
| 2025年 | 首次超过及格线 |
| 2026年 | 全面第一名 |
对此,LifePrompt负责人远藤聪志表示:「AI 的聪颖得到了充分展现,其进化速度飞快。」他并指出:「企业在导入 AI 时,应着眼于 10 年、20 年后的业务形态。」
此次测试结果也与全球 AI 发展趋势相呼应。 随着大型语言模型持续升级,AI已从过去的辅助工具,逐步转向可执行高阶认知任务的系统,甚至在标准化考试中超越人类顶尖群体。 分析人士认为,这不仅对教育制度构成挑战,也可能改变未来人才评量方式。
教育界普遍认为,传统以解题能力为核心的考试模式正面临压力,未来可能需更强调创造力、批判思考与跨领域整合能力。 同时,人机协作能力也可能成为新的关键指标。
随着 AI 能力持续突破,类似情况预料将不仅限于考试场域,医疗、法律与金融分析等专业领域亦可能出现 AI 与人类直接竞争的局面。 观察指出,这次ChatGPT在东大与京大考试中的表现,可能只是AI全面进入高知识密集领域的开端。













