AI 版可汗学院 — 学习第一性原理与人机边界
本文回答几个上层设计问题:哪些必须用人,哪些可以用技术解决;老师什么时候必要;自适应学习到底重要在哪里;学习体验、游戏化、视频、多媒体和老师讲解分别起什么作用;学生自主性和注意力如何培养。
核心判断:学习不是内容传递问题,而是学生持续投入有效努力,并在反馈中改变自己的过程。 AI、视频、游戏化、自适应、老师,都是为了让这个过程发生。
1. 第一性原理
1.1 学习来自主动生成,不来自被动接收
学生真正学会,通常发生在他自己尝试、表达、计算、解释、犯错、修正的时候,而不是单纯听懂一段讲解的时候。
产品含义:
- 任何知识原子都要让学生尽快做出一次尝试。
- AI 讲解之后必须接小任务:填一步、判断一步、解释原因、做变式。
- 视频和多媒体只能作为输入,不能替代练习和复述。
1.2 反馈必须足够快、足够准
没有反馈,努力会变成瞎练;反馈太慢,学生无法把错误和修正连接起来;反馈不准,则会强化错误概念。
产品含义:
- 数学题尽量做到步骤级反馈,而不是只给最终对错。
- AI 提示要基于学生已有尝试和错因,不要泛泛解释。
- 数学正确性由符号计算、规则引擎或标准答案校验,不能只靠 LLM 判断。
1.3 难度必须卡在最近发展区
太简单没有学习增益,太难会放弃。学习系统最重要的能力之一,是持续把学生放在“需要努力但能前进”的区域。
产品含义:
- 自适应学习的核心价值在这里:调节路径、题目、提示和复习节奏。
- 卡住不是失败,而是系统需要调整讲法、拆小步或回补前置知识的信号。
- 游戏化的挑战感必须服务这个难度控制,而不是单纯制造刺激。
1.4 掌握必须脱离辅助来验证
AI 帮会了,不等于学生会了。学生在提示、讲解、例题陪伴下做对,只能说明“辅助下可完成”。
产品含义:
- 掌握状态至少区分:看懂、辅助下正确、独立正确、延迟保持、迁移可用。
- 掌握判定必须记录提示依赖度。
- 撤掉 AI 后的无提示题、延迟复测、变式题、费曼解释都应进入掌握证据。
1.5 动机不是装饰,是学习发生的前提
不启动、不坚持,再好的内容都没有用。弱基础学生尤其需要外部结构、短周期成就和被看见的感觉。
产品含义:
- 每日任务要小、明确、可完成。
- 学生要看到“我正在变强”的证据,而不是只看到分数。
- 家长/老师的轻量问责不是附加功能,而是使用剂量保障机制。
1.6 人类关系提供意义、信任和问责
AI 可以陪练、解释、反馈、生成内容,但人更擅长提供关系、信任、意义和关键时刻的判断。
产品含义:
- v1 可以尽量减少真人实时服务,但不能假设人完全不重要。
- 家长、老师、志愿者应以低频高价值方式进入系统:审核、鼓励、疑难介入、目标校准。
- 产品要避免把学生变成被算法独自管理的对象。
2. 人和技术的边界
| 问题 | 技术适合解决 | 人更必要的部分 |
|---|---|---|
| 知识讲解 | 视频、AI 解释、多媒体、交互模拟 | 个性化比喻、临场判断、价值取舍 |
| 练习反馈 | 自动判题、错因识别、提示分级 | 开放题、复杂误区、表达质量判断 |
| 路径推荐 | 知识图谱、自适应、掌握追踪 | 升学目标、长期取舍、学习策略校准 |
| 学习坚持 | 打卡、提醒、周计划、家长周报、游戏化 | 关系、鼓励、信任、真实问责 |
| 情绪支持 | AI 初步安抚、挫败检测、节奏调节 | 自我否定、长期逃避、家庭冲突、焦虑 |
| 内容生产 | AI 生成题目/讲解/交互草稿 | 学科审核、质量判断、边界把关 |
| 掌握检测 | 自动题目、复测、间隔重复、提示依赖记录 | 迁移能力、解释质量、开放任务评价 |
原则:
技术负责高频、标准化、可验证、可规模化的部分;人负责关系、判断、意义、信任和复杂反馈。
3. 老师什么时候必要
3.1 老师必要的场景
老师、教练或高质量真人支持在以下场景更重要:
- 学生完全不启动,长期拖延或逃避。
- 学生连续卡住,系统提示和回补后仍无法前进。
- 学生出现明显情绪问题,比如觉得自己笨、害怕数学、准备放弃。
- 学习目标需要校准,比如是否补基础、提前学、应试冲刺、转国际路线。
- 开放性任务需要评价,比如写作、证明、建模、项目、表达。
- 内容需要审核,比如知识图谱、误区库、题目质量、兴趣类比是否靠谱。
- 高风险决策需要判断,比如升学路径、能力诊断、长期学习计划。
3.2 可以主要靠学生自学的场景
以下场景可以更多依赖系统、AI 和学生自学:
- 目标明确,比如“一元一次方程移项”。
- 标准答案可验证,比如代数计算、基础几何、选择/填空。
- 知识点能拆成短任务。
- 系统能提供即时反馈。
- 学生有最低限度动机,或有家长/老师轻量问责。
- 有掌握闸门和复习机制,防止假学会。
3.3 本项目推荐的人机协作结构
v1 不应设计成收费真人教练产品,但也不应把“无人”当作教育理想。
推荐结构:
学生主学
+ AI 陪练
+ 系统管路径和掌握
+ 家长轻问责
+ 老师做内容审核和疑难介入
这比“完全 AI 老师”更现实,也更符合公益开源项目的边界。
4. 自适应学习的重要性
4.1 自适应不是产品灵魂,而是控制系统
自适应学习重要,但它不是第一性原理本身。它的价值是控制学习过程:
- 现在该学什么。
- 题目难度是否合适。
- 哪个前置知识漏了。
- 什么时候该复习。
- 什么时候该降低难度。
- 什么时候可以解锁下一步。
它不直接解决:
- 学生为什么要开始。
- 学生为什么要坚持。
- 学生是否相信自己能学会。
- 学习体验是否有意义。
- 学生是否真的愿意动脑。
因此优先级应是:
学习闭环 > 动机与问责 > 反馈质量 > 掌握判定 > 自适应推荐 > 表现形式
4.2 v1 应采用可解释自适应
v1 不需要一上来做复杂的深度知识追踪或强化学习推荐。更稳妥的做法是:
- 知识图谱。
- 前置依赖。
- 错因标签。
- 提示层级。
- 独立正确率。
- 延迟复测。
- 简单可解释的掌握状态。
原因:
- 目标用户是未成年人,解释性和信任很重要。
- v1 数据不足,复杂模型容易冷启动不准。
- 家长和老师需要知道“为什么推荐这个”,而不是只看到黑箱结果。
4.3 自适应真正重要的三个点
- 防止太难导致放弃:系统能识别前置知识缺口并回补。
- 防止太简单导致空转:系统能让已掌握学生快速跳过重复内容。
- 防止遗忘导致假掌握:系统能安排间隔复习和延迟复测。
5. 学生自主性如何培养
自主性不是把学生放在那里让他自己学。那是放养。
真正的自主性是逐步训练出来的能力:
外部结构 -> 小选择 -> 元认知 -> 证据感 -> 自主路径
5.1 第一阶段:给外部结构
学生先需要知道:
- 今天学什么。
- 学多久。
- 做到什么算完成。
- 卡住怎么办。
产品设计:
- 今日任务。
- 预计用时。
- 明确完成条件。
- 卡住按钮和提示阶梯。
5.2 第二阶段:给小选择
选择太多会让弱基础学生放弃,但完全没选择会降低自主感。
适合给的小选择:
- 先看短讲解还是先做挑战题。
- 选择一个兴趣主题。
- 选择复习顺序。
- 选择今天做 1 个还是 2 个小任务。
5.3 第三阶段:训练元认知
学生要逐渐学会判断:
- 我到底哪里不会。
- 我是概念错、计算错,还是题意没读懂。
- 我下一步该看提示、回补前置知识,还是先画图。
产品设计:
- 错后让学生选择“我觉得我错在什么”。
- AI 反馈后让学生用一句话复述修正点。
- 每周复盘:这周我最常犯的错误是什么。
5.4 第四阶段:让学生看到证据
自主性需要自我效能感。学生要看到自己不是“感觉会了”,而是真的能独立完成。
产品设计:
- 显示独立掌握,而不是只显示完成。
- 显示延迟复测通过。
- 显示“本周你减少了哪类错误”。
6. 学习模式和学习体验的作用
学习体验很重要,但它不能替代有效努力。
| 形式 | 主要作用 | 主要风险 | 设计要求 |
|---|---|---|---|
| 视频 | 快速建立初步理解 | 被动观看,以为看懂就是会 | 视频后立刻接小题和复述 |
| 多媒体 | 降低抽象概念理解门槛 | 过花导致认知负荷增加 | 每次只服务一个概念 |
| 游戏化 | 提高启动率、回访率和挑战感 | 诱导刷分、追奖励、忽视掌握 | 奖励修错、复习、独立完成 |
| 老师生动讲解 | 激发兴趣、建立信任、降低恐惧 | 听爽但不练 | 讲解必须接练习和反馈 |
| AI 交互 | 即时陪练、提示、个性化表达 | 变答案机、制造依赖 | 学生先尝试,AI 再介入 |
| 生成式模拟 | 把抽象概念变成可操作对象 | 正确性和成本风险 | 模板约束、参数校验、可降级 |
原则:
学习体验负责让学生愿意进来、愿意停留、愿意再试;掌握闭环负责让学生真的学会。
7. 注意力如何培养
注意力不是靠“要求学生专注”培养的,而是靠任务设计和环境设计。
7.1 注意力的本质
本项目应把注意力定义为:
学生能在合适难度的问题上,持续投入可恢复的认知努力。
这里有三个关键词:
- 合适难度:不能太简单,也不能太难。
- 持续投入:不是被动盯屏幕,而是在做判断、计算、解释。
- 可恢复:短暂走神或失败后,系统能把学生拉回来。
7.2 设计方法
- 任务短:一次 5-12 分钟,而不是上来 45 分钟。
- 目标清楚:这一小节只解决一个问题。
- 反馈即时:做完马上知道结果。
- 难度合适:动态调整题目和提示。
- 交互频繁:不要连续看长视频。
- 进度可见:学生知道自己在变强。
- 干扰少:界面不要堆太多入口、徽章和活动。
- 有节奏:讲解、尝试、反馈、复做交替出现。
7.3 注意力不是越久越好
对弱基础学生,长时间学习不一定代表有效。v1 更应追求:
- 10 分钟内完成一个真实小闭环。
- 学生能在下次回来时接上。
- 学生愿意明天继续。
8. 对 v1 产品的直接要求
8.1 不应先做的东西
- 不要先做“万能 AI 老师聊天框”。
- 不要先做复杂排行榜和社交竞争。
- 不要把兴趣包装当核心差异化。
- 不要把视频课当主产品。
- 不要用做题量或使用时长替代掌握。
- 不要让 LLM 独立判断数学正确性。
8.2 应优先做的东西
- 今日任务和短学习闭环。
- 学生先尝试的题目状态机。
- 护栏式 AI 提示。
- 步骤级反馈和错因标签。
- 可解释掌握状态。
- 无提示复做、延迟复测、变式题。
- 家长周报和轻量鼓励。
- 教师审核的知识图谱、题目、误区和兴趣连接。
8.3 最小有效闭环
短诊断
-> 今日任务
-> 学生先尝试
-> AI 识别错因
-> 最小提示
-> 学生再试
-> 独立复做
-> 费曼解释
-> 延迟复测
-> 家长周报
这条闭环比单点功能更重要。任何新功能都应问:它是在强化这条闭环,还是在分散学生注意力?
9. 判断新功能的原则
新增功能时,用以下问题判断是否应该进入 v1:
- 它是否让学生更容易启动?
- 它是否让学生做出更多有效努力?
- 它是否让反馈更快、更准?
- 它是否帮助系统判断真实掌握?
- 它是否降低挫败,而不是逃避困难?
- 它是否增加家长/老师的有效支持,而不是增加监控压力?
- 它是否能在数学正确性和隐私上被校验?
如果一个功能只提升“热闹感”,但不能强化学习闭环,应延后。
10. 知识连接与项目化扩展
联通主义、费曼学习法、拼图教学法、跨学科学习和项目化学习都可以启发本项目,但它们必须服务同一件事:让学生主动建立知识之间的关系,并用这些关系完成解释、迁移和作品。
设计原则:
- 先强化个人学习闭环,再扩展同伴和项目系统。
- 先做受控知识连接,再做开放跨学科探索。
- 先让学生补一条关系边、解释一个前置关系,再要求他完成大项目。
- 任何项目、互教、上传和 AI 评价,都必须回收到知识图谱、掌握判定和延迟复测。
- AI 可以给形成性反馈,但不能单独决定开放作品的最终掌握、公开展示或高风险标签。
完整设计备忘见 learning-methods-expansion.md。
11. 一句话原则
AI 版可汗学院不要先做“AI 老师”。先做一个能让孩子每天完成有效学习闭环的系统。
好老师的本质不是讲得热闹,而是会诊断、拆小步、给反馈、鼓励、追问、复测、调整节奏。这个项目要产品化的是这套结构。