AI 版可汗学院 — 学习第一性原理与人机边界

本文回答几个上层设计问题：哪些必须用人，哪些可以用技术解决；老师什么时候必要；自适应学习到底重要在哪里；学习体验、游戏化、视频、多媒体和老师讲解分别起什么作用；学生自主性和注意力如何培养。

核心判断：学习不是内容传递问题，而是学生持续投入有效努力，并在反馈中改变自己的过程。 AI、视频、游戏化、自适应、老师，都是为了让这个过程发生。

1. 第一性原理

1.1 学习来自主动生成，不来自被动接收

学生真正学会，通常发生在他自己尝试、表达、计算、解释、犯错、修正的时候，而不是单纯听懂一段讲解的时候。

产品含义：

任何知识原子都要让学生尽快做出一次尝试。
AI 讲解之后必须接小任务：填一步、判断一步、解释原因、做变式。
视频和多媒体只能作为输入，不能替代练习和复述。

1.2 反馈必须足够快、足够准

没有反馈，努力会变成瞎练；反馈太慢，学生无法把错误和修正连接起来；反馈不准，则会强化错误概念。

产品含义：

数学题尽量做到步骤级反馈，而不是只给最终对错。
AI 提示要基于学生已有尝试和错因，不要泛泛解释。
数学正确性由符号计算、规则引擎或标准答案校验，不能只靠 LLM 判断。

1.3 难度必须卡在最近发展区

太简单没有学习增益，太难会放弃。学习系统最重要的能力之一，是持续把学生放在“需要努力但能前进”的区域。

产品含义：

自适应学习的核心价值在这里：调节路径、题目、提示和复习节奏。
卡住不是失败，而是系统需要调整讲法、拆小步或回补前置知识的信号。
游戏化的挑战感必须服务这个难度控制，而不是单纯制造刺激。

1.4 掌握必须脱离辅助来验证

AI 帮会了，不等于学生会了。学生在提示、讲解、例题陪伴下做对，只能说明“辅助下可完成”。

产品含义：

掌握状态至少区分：看懂、辅助下正确、独立正确、延迟保持、迁移可用。
掌握判定必须记录提示依赖度。
撤掉 AI 后的无提示题、延迟复测、变式题、费曼解释都应进入掌握证据。

1.5 动机不是装饰，是学习发生的前提

不启动、不坚持，再好的内容都没有用。弱基础学生尤其需要外部结构、短周期成就和被看见的感觉。

产品含义：

每日任务要小、明确、可完成。
学生要看到“我正在变强”的证据，而不是只看到分数。
家长/老师的轻量问责不是附加功能，而是使用剂量保障机制。

1.6 人类关系提供意义、信任和问责

AI 可以陪练、解释、反馈、生成内容，但人更擅长提供关系、信任、意义和关键时刻的判断。

产品含义：

v1 可以尽量减少真人实时服务，但不能假设人完全不重要。
家长、老师、志愿者应以低频高价值方式进入系统：审核、鼓励、疑难介入、目标校准。
产品要避免把学生变成被算法独自管理的对象。

2. 人和技术的边界

问题	技术适合解决	人更必要的部分
知识讲解	视频、AI 解释、多媒体、交互模拟	个性化比喻、临场判断、价值取舍
练习反馈	自动判题、错因识别、提示分级	开放题、复杂误区、表达质量判断
路径推荐	知识图谱、自适应、掌握追踪	升学目标、长期取舍、学习策略校准
学习坚持	打卡、提醒、周计划、家长周报、游戏化	关系、鼓励、信任、真实问责
情绪支持	AI 初步安抚、挫败检测、节奏调节	自我否定、长期逃避、家庭冲突、焦虑
内容生产	AI 生成题目/讲解/交互草稿	学科审核、质量判断、边界把关
掌握检测	自动题目、复测、间隔重复、提示依赖记录	迁移能力、解释质量、开放任务评价

原则：

技术负责高频、标准化、可验证、可规模化的部分；人负责关系、判断、意义、信任和复杂反馈。

3. 老师什么时候必要

3.1 老师必要的场景

老师、教练或高质量真人支持在以下场景更重要：

学生完全不启动，长期拖延或逃避。
学生连续卡住，系统提示和回补后仍无法前进。
学生出现明显情绪问题，比如觉得自己笨、害怕数学、准备放弃。
学习目标需要校准，比如是否补基础、提前学、应试冲刺、转国际路线。
开放性任务需要评价，比如写作、证明、建模、项目、表达。
内容需要审核，比如知识图谱、误区库、题目质量、兴趣类比是否靠谱。
高风险决策需要判断，比如升学路径、能力诊断、长期学习计划。

3.2 可以主要靠学生自学的场景

以下场景可以更多依赖系统、AI 和学生自学：

目标明确，比如“一元一次方程移项”。
标准答案可验证，比如代数计算、基础几何、选择/填空。
知识点能拆成短任务。
系统能提供即时反馈。
学生有最低限度动机，或有家长/老师轻量问责。
有掌握闸门和复习机制，防止假学会。

3.3 本项目推荐的人机协作结构

v1 不应设计成收费真人教练产品，但也不应把“无人”当作教育理想。

推荐结构：

学生主学
+ AI 陪练
+ 系统管路径和掌握
+ 家长轻问责
+ 老师做内容审核和疑难介入

这比“完全 AI 老师”更现实，也更符合公益开源项目的边界。

4. 自适应学习的重要性

4.1 自适应不是产品灵魂，而是控制系统

自适应学习重要，但它不是第一性原理本身。它的价值是控制学习过程：

现在该学什么。
题目难度是否合适。
哪个前置知识漏了。
什么时候该复习。
什么时候该降低难度。
什么时候可以解锁下一步。

它不直接解决：

学生为什么要开始。
学生为什么要坚持。
学生是否相信自己能学会。
学习体验是否有意义。
学生是否真的愿意动脑。

因此优先级应是：

学习闭环 > 动机与问责 > 反馈质量 > 掌握判定 > 自适应推荐 > 表现形式

4.2 v1 应采用可解释自适应

v1 不需要一上来做复杂的深度知识追踪或强化学习推荐。更稳妥的做法是：

知识图谱。
前置依赖。
错因标签。
提示层级。
独立正确率。
延迟复测。
简单可解释的掌握状态。

原因：

目标用户是未成年人，解释性和信任很重要。
v1 数据不足，复杂模型容易冷启动不准。
家长和老师需要知道“为什么推荐这个”，而不是只看到黑箱结果。

4.3 自适应真正重要的三个点

防止太难导致放弃：系统能识别前置知识缺口并回补。
防止太简单导致空转：系统能让已掌握学生快速跳过重复内容。
防止遗忘导致假掌握：系统能安排间隔复习和延迟复测。

5. 学生自主性如何培养

自主性不是把学生放在那里让他自己学。那是放养。

真正的自主性是逐步训练出来的能力：

外部结构 -> 小选择 -> 元认知 -> 证据感 -> 自主路径

5.1 第一阶段：给外部结构

学生先需要知道：

今天学什么。
学多久。
做到什么算完成。
卡住怎么办。

产品设计：

今日任务。
预计用时。
明确完成条件。
卡住按钮和提示阶梯。

5.2 第二阶段：给小选择

选择太多会让弱基础学生放弃，但完全没选择会降低自主感。

适合给的小选择：

先看短讲解还是先做挑战题。
选择一个兴趣主题。
选择复习顺序。
选择今天做 1 个还是 2 个小任务。

5.3 第三阶段：训练元认知

学生要逐渐学会判断：

我到底哪里不会。
我是概念错、计算错，还是题意没读懂。
我下一步该看提示、回补前置知识，还是先画图。

产品设计：

错后让学生选择“我觉得我错在什么”。
AI 反馈后让学生用一句话复述修正点。
每周复盘：这周我最常犯的错误是什么。

5.4 第四阶段：让学生看到证据

自主性需要自我效能感。学生要看到自己不是“感觉会了”，而是真的能独立完成。

产品设计：

显示独立掌握，而不是只显示完成。
显示延迟复测通过。
显示“本周你减少了哪类错误”。

6. 学习模式和学习体验的作用

学习体验很重要，但它不能替代有效努力。

形式	主要作用	主要风险	设计要求
视频	快速建立初步理解	被动观看，以为看懂就是会	视频后立刻接小题和复述
多媒体	降低抽象概念理解门槛	过花导致认知负荷增加	每次只服务一个概念
游戏化	提高启动率、回访率和挑战感	诱导刷分、追奖励、忽视掌握	奖励修错、复习、独立完成
老师生动讲解	激发兴趣、建立信任、降低恐惧	听爽但不练	讲解必须接练习和反馈
AI 交互	即时陪练、提示、个性化表达	变答案机、制造依赖	学生先尝试，AI 再介入
生成式模拟	把抽象概念变成可操作对象	正确性和成本风险	模板约束、参数校验、可降级

原则：

学习体验负责让学生愿意进来、愿意停留、愿意再试；掌握闭环负责让学生真的学会。

7. 注意力如何培养

注意力不是靠“要求学生专注”培养的，而是靠任务设计和环境设计。

7.1 注意力的本质

本项目应把注意力定义为：

学生能在合适难度的问题上，持续投入可恢复的认知努力。

这里有三个关键词：

合适难度：不能太简单，也不能太难。
持续投入：不是被动盯屏幕，而是在做判断、计算、解释。
可恢复：短暂走神或失败后，系统能把学生拉回来。

7.2 设计方法

任务短：一次 5-12 分钟，而不是上来 45 分钟。
目标清楚：这一小节只解决一个问题。
反馈即时：做完马上知道结果。
难度合适：动态调整题目和提示。
交互频繁：不要连续看长视频。
进度可见：学生知道自己在变强。
干扰少：界面不要堆太多入口、徽章和活动。
有节奏：讲解、尝试、反馈、复做交替出现。

7.3 注意力不是越久越好

对弱基础学生，长时间学习不一定代表有效。v1 更应追求：

10 分钟内完成一个真实小闭环。
学生能在下次回来时接上。
学生愿意明天继续。

8. 对 v1 产品的直接要求

8.1 不应先做的东西

不要先做“万能 AI 老师聊天框”。
不要先做复杂排行榜和社交竞争。
不要把兴趣包装当核心差异化。
不要把视频课当主产品。
不要用做题量或使用时长替代掌握。
不要让 LLM 独立判断数学正确性。

8.2 应优先做的东西

今日任务和短学习闭环。
学生先尝试的题目状态机。
护栏式 AI 提示。
步骤级反馈和错因标签。
可解释掌握状态。
无提示复做、延迟复测、变式题。
家长周报和轻量鼓励。
教师审核的知识图谱、题目、误区和兴趣连接。

8.3 最小有效闭环

短诊断
-> 今日任务
-> 学生先尝试
-> AI 识别错因
-> 最小提示
-> 学生再试
-> 独立复做
-> 费曼解释
-> 延迟复测
-> 家长周报

这条闭环比单点功能更重要。任何新功能都应问：它是在强化这条闭环，还是在分散学生注意力？

9. 判断新功能的原则

新增功能时，用以下问题判断是否应该进入 v1：

它是否让学生更容易启动？
它是否让学生做出更多有效努力？
它是否让反馈更快、更准？
它是否帮助系统判断真实掌握？
它是否降低挫败，而不是逃避困难？
它是否增加家长/老师的有效支持，而不是增加监控压力？
它是否能在数学正确性和隐私上被校验？

如果一个功能只提升“热闹感”，但不能强化学习闭环，应延后。

10. 知识连接与项目化扩展

联通主义、费曼学习法、拼图教学法、跨学科学习和项目化学习都可以启发本项目，但它们必须服务同一件事：让学生主动建立知识之间的关系，并用这些关系完成解释、迁移和作品。

设计原则：

先强化个人学习闭环，再扩展同伴和项目系统。
先做受控知识连接，再做开放跨学科探索。
先让学生补一条关系边、解释一个前置关系，再要求他完成大项目。
任何项目、互教、上传和 AI 评价，都必须回收到知识图谱、掌握判定和延迟复测。
AI 可以给形成性反馈，但不能单独决定开放作品的最终掌握、公开展示或高风险标签。

完整设计备忘见 learning-methods-expansion.md。

11. 一句话原则

AI 版可汗学院不要先做“AI 老师”。先做一个能让孩子每天完成有效学习闭环的系统。

好老师的本质不是讲得热闹，而是会诊断、拆小步、给反馈、鼓励、追问、复测、调整节奏。这个项目要产品化的是这套结构。