AI 版可汗学院 — 产品与学习体验设计
本文回答“怎么设计”。
PRD.md定义 v1 做什么,requirements-ears.md定义可测试需求,本文承接学习体验、系统结构和内容生产机制。 上层学习原则、人机边界、自适应学习价值与注意力设计见 learning-principles.md。
1. 设计目标
v1 的设计目标是跑通一条数学学习闭环:
诊断起点 → 知识原子 → AI 生成式交互 → 护栏式练习 → 掌握判定 → 费曼出口 → 家长周报
这个闭环要同时满足两个指标:
- 用得爽:孩子愿意持续进入学习过程。
- 学得会:撤掉 AI 后仍能独立迁移、解释和解题。
因此产品不是“视频课 + AI 答疑”,而是一个有路径、有反馈、有挑战、有解释出口的 AI 原生学习系统。
2. 产品分层
2.1 开源公益底座
开源层面向公益普惠和社区共创,建议包含:
- 知识图谱与知识原子定义。
- 基础学习路径和掌握规则。
- 护栏式解题流模板。
- 数学自动验答与题目校验接口。
- 教师共创流程、内容元数据规范。
- 部分可复用交互组件和 Agent 工作流。
开源层的目标是建立信任、吸引共创、降低重复造轮子成本。
2.2 学习体验层
学习体验层面向学生和家长,负责把底座组织成可持续使用的体验:
- 诊断地图。
- 生成式交互讲解。
- 兴趣定制呈现。
- 题目练习与提示。
- 掌握状态与解锁。
- 费曼输出。
- 家长仪表盘与周报。
2.3 共创自进化层
共创层负责把老师、学生、志愿者和 AI Agent 的贡献纳入稳定流程:
- Feature Request / Bug Report。
- 内容草稿生成。
- 学科老师审核。
- Staging 与 Canon 分区。
- AI 自动实现局部改动。
- 人工 review 后上线。
学生侧永远只看到 Canon 稳定版。
3. 学习体验主循环
3.1 诊断起点
首次进入某条学习主线时,系统不从年级头灌,而是用少量自适应题定位起点。
设计要求:
- 题量控制在几分钟内完成。
- 题目覆盖关键前置知识,而不是平均覆盖全章。
- 对乱答、秒点、连续异常作答做识别。
- 输出“已掌握 / 薄弱 / 建议从哪里开始”的地图。
- 支持中途退出后继续接上。
3.2 知识原子
每个学习单元对应一个知识原子。知识原子至少包含:
- 节点 ID。
- 名称。
- 所属主线。
- 前置依赖。
- 年级与课标。
- 难度。
- 学习目标。
- 常见错因。
- 可用交互模板。
- 可用题型。
- 掌握判定标准。
- 费曼出口提示。
知识原子的粒度要足够小,使系统能诊断、练习、反馈和补救,而不是只知道“代数很差”。
3.3 AI 生成式交互
生成式交互是产品心脏,但它不能裸奔。每次生成都应受到知识原子、交互模板、兴趣连接库和数学校验的约束。
运行流程:
- 输入知识原子、学生画像、当前错因、兴趣偏好。
- 检索 verified 兴趣-学科连接。
- 选择交互模板或生成新交互草稿。
- 校验数学表达、边界条件和答案。
- 渲染给学生。
- 记录学生操作和理解状态。
降级规则:
- 生成超时:切换到标准交互或视频+题库。
- 校验失败:不得展示,重新生成或降级。
- 无兴趣连接:回到中性严谨呈现。
- 设备能力不足:切到轻量交互或文本+图示。
3.4 护栏式练习
练习环节遵循“AI 永不直接给答案”的架构级约束。
提示梯度:
- 复述学生当前思路。
- 定位错误类型。
- 给方向性提示。
- 要求学生再试。
- 苏格拉底追问关键变量或关系。
- 拆成更小步骤,但每步仍由学生完成。
- 仍失败时,切换讲法或换题,不无限追问。
系统需要区分三种失败:
- 概念不懂:回到交互讲解或样例。
- 计算错误:给局部计算提示和自动验答。
- 题意理解错误:引导画图、列变量、重述问题。
3.5 掌握判定
掌握判定不能只看一题是否答对。建议由四个信号组成:
- 正确率:达到阈值。
- 独立性:少提示或无提示完成。
- 迁移性:能做变式题。
- 解释性:能用自己的话讲清楚。
具体阈值仍待 L0 知识架构师确认。默认建议先采用可调参数,而不是写死到产品逻辑中。
3.6 费曼出口
每个关键知识原子完成后,系统要求学生讲给 AI 听。
设计要求:
- v1 先支持文字输入。
- AI 扮演“听不懂的同学”,追问含糊处。
- 追问聚焦概念关系,不纠缠表达风格。
- 费曼输出结果进入掌握判定,但不直接作为唯一凭据。
- 允许学生二次改写,形成可见进步。
4. 游戏化与动机设计
本项目的游戏化不是积分、徽章、皮肤的堆叠,而是把学习组织成有目标、有反馈、有挑战、有成长感的过程。
4.1 关卡结构
每个知识原子可以设计为一个关卡:
- 开场挑战:一个让学生意识到问题的情境。
- 交互探索:拖拽、选择、构造、观察。
- 关键发现:学生自己说出规律。
- 练习巩固:从带提示到少提示。
- 掌握检查:独立完成变式。
- 解释出口:讲给 AI 或同伴听。
4.2 必要难度
学习体验需要有“刚好难”的设计:
- 太简单:学生只是滑过去,没有学习增益。
- 太难:学生进入挫败,放弃。
- 合适:学生需要思考,但能在提示下前进。
系统应把困难变成可恢复的挑战,而不是死路。
4.3 正向反馈
反馈要具体,不要空泛夸奖。
好的反馈:
- “你把两个未知量都设出来了,下一步只差把数量关系写成方程。”
- “这次你没有直接猜答案,而是先画了关系图,这是进步。”
不好的反馈:
- “太棒了!”
- “再试试。”
4.4 兴趣定制
兴趣定制只服务理解和动机,不改变知识目标。
三类连接:
- 情境包装:题目背景换成孩子熟悉的场景。
- 概念类比:用兴趣机制解释抽象关系。
- 视觉皮肤:界面和角色风格调整。
概念类比风险最高,必须经过学科审核。
5. 学科设计
5.1 数学 v1
v1 建议继续聚焦初中代数主线,原因是:
- 知识依赖清晰,适合知识图谱。
- 自动验答可行,能控制 AI 幻觉。
- 错因类型相对可枚举。
- 掌握式学习价值明显。
数学学习目标不止是会算,还包括:
- 把现实问题转化为数学表达。
- 知道变量、关系、方程分别是什么。
- 能判断答案是否合理。
- 能解释自己为什么这样列式。
5.2 英语 v1.1 候选
英语适合作为快速跟进,但不建议抢 v1 主线资源。
可迁移机制:
- Read Aloud 作为低门槛入口。
- AI 发音反馈。
- 可理解输入。
- 低焦虑输出。
- Door Check / 掌握检查。
- 家长或教师端进度可见。
英语的关键风险是双重认知负荷。弱基础学生同时处理内容理解和语言形式时容易崩溃,因此主题要简单、语言密度要可控。
5.3 项目工作室与学科副本
“AI 学科副本”适合体现超脑特色:学生不是只在题目里证明自己会了,而是在真实问题、跨学科情境和项目作品里证明自己能迁移。
示例:
- 给视障跑者设计提醒系统。
- 给家人设计健康饮食助手。
- 做一个茶文化小游戏。
系统把真实问题拆出相关学科知识、AI 工具、设计思维和表达任务。学生最终完成作品,而不仅是做题。
项目化、跨学科、同伴互教和学生主动构建概念图的完整形态见 learning-methods-expansion.md。核心边界是:项目必须回到知识节点、掌握证据和迁移证据,而不是只提升作品热闹感。
6. 家长仪表盘
家长仪表盘的定位是鼓励式问责,不是监控。
6.1 核心问题
家长只需要回答四个问题:
- 学到哪了?
- 有没有漏?
- 是不是在认真学?
- 现在卡在哪里,下一步怎么帮?
6.2 页面模块
- 学习地图:主线位置与已掌握节点。
- 掌握热力图:红黄绿显示薄弱点。
- 投入趋势:本周时长、连续天数、活跃变化。
- 卡点摘要:最近反复失败的概念或题型。
- 一键鼓励:家长向孩子发送鼓励。
- 周报推送:微信或邮件发送自然语言摘要。
6.3 隐私边界
- 默认展示成长和建议,不展示羞辱性排行。
- 孩子知道哪些信息对家长可见。
- 家长只读,不能替孩子做题、改进度或跳过掌握检查。
7. 内容与共创机制
7.1 分层角色
- L0 知识架构师:定义主线、标准和质量门。
- L1 学科负责人:审核与 Merge,权力不可绕过。
- L2 内容贡献者:生成或编辑题目、讲解、类比。
- L3 审核志愿者:勘误、标注、二审。
- L4 学习者社区:提交难度反馈、错题解释、类比建议。
7.2 内容状态
- Draft:AI 或贡献者生成草稿。
- Staging:已提交审核,未对学生开放。
- Canon:已审核稳定版,可进入学生侧。
- Deprecated:已被替换,但保留历史。
7.3 元数据
每个内容单元必须带:
- 知识点 ID。
- 年级。
- 难度。
- 课标。
- 贡献者。
- 审核者。
- 版本。
- 适用场景。
- 常见错因。
- 相关兴趣连接。
7.4 作者不审自己内容
任何进入 Canon 的内容都必须经过非作者审核。AI 生成内容也视为“作者”为 AI/提交者,不得自动上线。
8. 系统质量门
8.1 数学正确性
- 所有数学答案、等价变换、提示中的关键判断必须校验。
- 校验失败不得展示给学生。
- 对无法自动校验的开放解释,至少要经过规则检查和人工抽检。
8.2 生成稳定性
- 每个知识原子必须有标准兜底路径。
- 生成式内容失败不能中断学习。
- 热门节点应支持缓存或预生成。
8.3 学习效果
- 不只看完成率,要看掌握率。
- 不只看平台内正确率,要看撤掉 AI 后的迁移测试。
- 不只看孩子是否喜欢,要看是否能解释。
9. v1 里程碑映射
M1 知识图谱 + 诊断
- 建立初中代数主线知识原子。
- 实现诊断题流。
- 接入数学自动验答。
- 输出起点地图。
M2 心脏 + 护栏
- 实现至少 2-3 个核心知识原子的生成式交互。
- 实现护栏式提示流。
- 建立视频+题库兜底。
- 建立兴趣连接种子库。
M3 闭环 + 留存
- 实现掌握判定。
- 实现费曼出口。
- 实现家长仪表盘与周报。
M4 验证
- 找 10-20 名学生封闭测试。
- 观察次日/7 日留存、单次学习时长、掌握率、迁移测试结果。
- 整理 3 个学习案例。
10. 待决策事项
- 掌握判定阈值由谁定,以及初始阈值是多少。
- 诊断题量上限和首次体验时长目标。
- 家长可见信息的隐私默认值。
- 兴趣连接库的首批兴趣范围。
- 教师共创在 v1 是产品内功能,还是先用 GitHub/表单/Issue 流承接。