AI 版可汗学院 — 产品与学习体验设计

2026-06-14 design

AI 版可汗学院 — 产品与学习体验设计

本文回答“怎么设计”。PRD.md 定义 v1 做什么,requirements-ears.md 定义可测试需求,本文承接学习体验、系统结构和内容生产机制。 上层学习原则、人机边界、自适应学习价值与注意力设计见 learning-principles.md

1. 设计目标

v1 的设计目标是跑通一条数学学习闭环:

诊断起点 → 知识原子 → AI 生成式交互 → 护栏式练习 → 掌握判定 → 费曼出口 → 家长周报

这个闭环要同时满足两个指标:

  • 用得爽:孩子愿意持续进入学习过程。
  • 学得会:撤掉 AI 后仍能独立迁移、解释和解题。

因此产品不是“视频课 + AI 答疑”,而是一个有路径、有反馈、有挑战、有解释出口的 AI 原生学习系统。

2. 产品分层

2.1 开源公益底座

开源层面向公益普惠和社区共创,建议包含:

  • 知识图谱与知识原子定义。
  • 基础学习路径和掌握规则。
  • 护栏式解题流模板。
  • 数学自动验答与题目校验接口。
  • 教师共创流程、内容元数据规范。
  • 部分可复用交互组件和 Agent 工作流。

开源层的目标是建立信任、吸引共创、降低重复造轮子成本。

2.2 学习体验层

学习体验层面向学生和家长,负责把底座组织成可持续使用的体验:

  • 诊断地图。
  • 生成式交互讲解。
  • 兴趣定制呈现。
  • 题目练习与提示。
  • 掌握状态与解锁。
  • 费曼输出。
  • 家长仪表盘与周报。

2.3 共创自进化层

共创层负责把老师、学生、志愿者和 AI Agent 的贡献纳入稳定流程:

  • Feature Request / Bug Report。
  • 内容草稿生成。
  • 学科老师审核。
  • Staging 与 Canon 分区。
  • AI 自动实现局部改动。
  • 人工 review 后上线。

学生侧永远只看到 Canon 稳定版。

3. 学习体验主循环

3.1 诊断起点

首次进入某条学习主线时,系统不从年级头灌,而是用少量自适应题定位起点。

设计要求:

  • 题量控制在几分钟内完成。
  • 题目覆盖关键前置知识,而不是平均覆盖全章。
  • 对乱答、秒点、连续异常作答做识别。
  • 输出“已掌握 / 薄弱 / 建议从哪里开始”的地图。
  • 支持中途退出后继续接上。

3.2 知识原子

每个学习单元对应一个知识原子。知识原子至少包含:

  • 节点 ID。
  • 名称。
  • 所属主线。
  • 前置依赖。
  • 年级与课标。
  • 难度。
  • 学习目标。
  • 常见错因。
  • 可用交互模板。
  • 可用题型。
  • 掌握判定标准。
  • 费曼出口提示。

知识原子的粒度要足够小,使系统能诊断、练习、反馈和补救,而不是只知道“代数很差”。

3.3 AI 生成式交互

生成式交互是产品心脏,但它不能裸奔。每次生成都应受到知识原子、交互模板、兴趣连接库和数学校验的约束。

运行流程:

  1. 输入知识原子、学生画像、当前错因、兴趣偏好。
  2. 检索 verified 兴趣-学科连接。
  3. 选择交互模板或生成新交互草稿。
  4. 校验数学表达、边界条件和答案。
  5. 渲染给学生。
  6. 记录学生操作和理解状态。

降级规则:

  • 生成超时:切换到标准交互或视频+题库。
  • 校验失败:不得展示,重新生成或降级。
  • 无兴趣连接:回到中性严谨呈现。
  • 设备能力不足:切到轻量交互或文本+图示。

3.4 护栏式练习

练习环节遵循“AI 永不直接给答案”的架构级约束。

提示梯度:

  1. 复述学生当前思路。
  2. 定位错误类型。
  3. 给方向性提示。
  4. 要求学生再试。
  5. 苏格拉底追问关键变量或关系。
  6. 拆成更小步骤,但每步仍由学生完成。
  7. 仍失败时,切换讲法或换题,不无限追问。

系统需要区分三种失败:

  • 概念不懂:回到交互讲解或样例。
  • 计算错误:给局部计算提示和自动验答。
  • 题意理解错误:引导画图、列变量、重述问题。

3.5 掌握判定

掌握判定不能只看一题是否答对。建议由四个信号组成:

  • 正确率:达到阈值。
  • 独立性:少提示或无提示完成。
  • 迁移性:能做变式题。
  • 解释性:能用自己的话讲清楚。

具体阈值仍待 L0 知识架构师确认。默认建议先采用可调参数,而不是写死到产品逻辑中。

3.6 费曼出口

每个关键知识原子完成后,系统要求学生讲给 AI 听。

设计要求:

  • v1 先支持文字输入。
  • AI 扮演“听不懂的同学”,追问含糊处。
  • 追问聚焦概念关系,不纠缠表达风格。
  • 费曼输出结果进入掌握判定,但不直接作为唯一凭据。
  • 允许学生二次改写,形成可见进步。

4. 游戏化与动机设计

本项目的游戏化不是积分、徽章、皮肤的堆叠,而是把学习组织成有目标、有反馈、有挑战、有成长感的过程。

4.1 关卡结构

每个知识原子可以设计为一个关卡:

  • 开场挑战:一个让学生意识到问题的情境。
  • 交互探索:拖拽、选择、构造、观察。
  • 关键发现:学生自己说出规律。
  • 练习巩固:从带提示到少提示。
  • 掌握检查:独立完成变式。
  • 解释出口:讲给 AI 或同伴听。

4.2 必要难度

学习体验需要有“刚好难”的设计:

  • 太简单:学生只是滑过去,没有学习增益。
  • 太难:学生进入挫败,放弃。
  • 合适:学生需要思考,但能在提示下前进。

系统应把困难变成可恢复的挑战,而不是死路。

4.3 正向反馈

反馈要具体,不要空泛夸奖。

好的反馈:

  • “你把两个未知量都设出来了,下一步只差把数量关系写成方程。”
  • “这次你没有直接猜答案,而是先画了关系图,这是进步。”

不好的反馈:

  • “太棒了!”
  • “再试试。”

4.4 兴趣定制

兴趣定制只服务理解和动机,不改变知识目标。

三类连接:

  • 情境包装:题目背景换成孩子熟悉的场景。
  • 概念类比:用兴趣机制解释抽象关系。
  • 视觉皮肤:界面和角色风格调整。

概念类比风险最高,必须经过学科审核。

5. 学科设计

5.1 数学 v1

v1 建议继续聚焦初中代数主线,原因是:

  • 知识依赖清晰,适合知识图谱。
  • 自动验答可行,能控制 AI 幻觉。
  • 错因类型相对可枚举。
  • 掌握式学习价值明显。

数学学习目标不止是会算,还包括:

  • 把现实问题转化为数学表达。
  • 知道变量、关系、方程分别是什么。
  • 能判断答案是否合理。
  • 能解释自己为什么这样列式。

5.2 英语 v1.1 候选

英语适合作为快速跟进,但不建议抢 v1 主线资源。

可迁移机制:

  • Read Aloud 作为低门槛入口。
  • AI 发音反馈。
  • 可理解输入。
  • 低焦虑输出。
  • Door Check / 掌握检查。
  • 家长或教师端进度可见。

英语的关键风险是双重认知负荷。弱基础学生同时处理内容理解和语言形式时容易崩溃,因此主题要简单、语言密度要可控。

5.3 项目工作室与学科副本

“AI 学科副本”适合体现超脑特色:学生不是只在题目里证明自己会了,而是在真实问题、跨学科情境和项目作品里证明自己能迁移。

示例:

  • 给视障跑者设计提醒系统。
  • 给家人设计健康饮食助手。
  • 做一个茶文化小游戏。

系统把真实问题拆出相关学科知识、AI 工具、设计思维和表达任务。学生最终完成作品,而不仅是做题。

项目化、跨学科、同伴互教和学生主动构建概念图的完整形态见 learning-methods-expansion.md。核心边界是:项目必须回到知识节点、掌握证据和迁移证据,而不是只提升作品热闹感。

6. 家长仪表盘

家长仪表盘的定位是鼓励式问责,不是监控。

6.1 核心问题

家长只需要回答四个问题:

  • 学到哪了?
  • 有没有漏?
  • 是不是在认真学?
  • 现在卡在哪里,下一步怎么帮?

6.2 页面模块

  • 学习地图:主线位置与已掌握节点。
  • 掌握热力图:红黄绿显示薄弱点。
  • 投入趋势:本周时长、连续天数、活跃变化。
  • 卡点摘要:最近反复失败的概念或题型。
  • 一键鼓励:家长向孩子发送鼓励。
  • 周报推送:微信或邮件发送自然语言摘要。

6.3 隐私边界

  • 默认展示成长和建议,不展示羞辱性排行。
  • 孩子知道哪些信息对家长可见。
  • 家长只读,不能替孩子做题、改进度或跳过掌握检查。

7. 内容与共创机制

7.1 分层角色

  • L0 知识架构师:定义主线、标准和质量门。
  • L1 学科负责人:审核与 Merge,权力不可绕过。
  • L2 内容贡献者:生成或编辑题目、讲解、类比。
  • L3 审核志愿者:勘误、标注、二审。
  • L4 学习者社区:提交难度反馈、错题解释、类比建议。

7.2 内容状态

  • Draft:AI 或贡献者生成草稿。
  • Staging:已提交审核,未对学生开放。
  • Canon:已审核稳定版,可进入学生侧。
  • Deprecated:已被替换,但保留历史。

7.3 元数据

每个内容单元必须带:

  • 知识点 ID。
  • 年级。
  • 难度。
  • 课标。
  • 贡献者。
  • 审核者。
  • 版本。
  • 适用场景。
  • 常见错因。
  • 相关兴趣连接。

7.4 作者不审自己内容

任何进入 Canon 的内容都必须经过非作者审核。AI 生成内容也视为“作者”为 AI/提交者,不得自动上线。

8. 系统质量门

8.1 数学正确性

  • 所有数学答案、等价变换、提示中的关键判断必须校验。
  • 校验失败不得展示给学生。
  • 对无法自动校验的开放解释,至少要经过规则检查和人工抽检。

8.2 生成稳定性

  • 每个知识原子必须有标准兜底路径。
  • 生成式内容失败不能中断学习。
  • 热门节点应支持缓存或预生成。

8.3 学习效果

  • 不只看完成率,要看掌握率。
  • 不只看平台内正确率,要看撤掉 AI 后的迁移测试。
  • 不只看孩子是否喜欢,要看是否能解释。

9. v1 里程碑映射

M1 知识图谱 + 诊断

  • 建立初中代数主线知识原子。
  • 实现诊断题流。
  • 接入数学自动验答。
  • 输出起点地图。

M2 心脏 + 护栏

  • 实现至少 2-3 个核心知识原子的生成式交互。
  • 实现护栏式提示流。
  • 建立视频+题库兜底。
  • 建立兴趣连接种子库。

M3 闭环 + 留存

  • 实现掌握判定。
  • 实现费曼出口。
  • 实现家长仪表盘与周报。

M4 验证

  • 找 10-20 名学生封闭测试。
  • 观察次日/7 日留存、单次学习时长、掌握率、迁移测试结果。
  • 整理 3 个学习案例。

10. 待决策事项

  1. 掌握判定阈值由谁定,以及初始阈值是多少。
  2. 诊断题量上限和首次体验时长目标。
  3. 家长可见信息的隐私默认值。
  4. 兴趣连接库的首批兴趣范围。
  5. 教师共创在 v1 是产品内功能,还是先用 GitHub/表单/Issue 流承接。