AI 版可汗学院 — 产品与学习体验设计

本文回答“怎么设计”。PRD.md 定义 v1 做什么，requirements-ears.md 定义可测试需求，本文承接学习体验、系统结构和内容生产机制。上层学习原则、人机边界、自适应学习价值与注意力设计见 learning-principles.md。

1. 设计目标

v1 的设计目标是跑通一条数学学习闭环：

诊断起点 → 知识原子 → AI 生成式交互 → 护栏式练习 → 掌握判定 → 费曼出口 → 家长周报

这个闭环要同时满足两个指标：

用得爽：孩子愿意持续进入学习过程。
学得会：撤掉 AI 后仍能独立迁移、解释和解题。

因此产品不是“视频课 + AI 答疑”，而是一个有路径、有反馈、有挑战、有解释出口的 AI 原生学习系统。

2. 产品分层

2.1 开源公益底座

开源层面向公益普惠和社区共创，建议包含：

知识图谱与知识原子定义。
基础学习路径和掌握规则。
护栏式解题流模板。
数学自动验答与题目校验接口。
教师共创流程、内容元数据规范。
部分可复用交互组件和 Agent 工作流。

开源层的目标是建立信任、吸引共创、降低重复造轮子成本。

2.2 学习体验层

学习体验层面向学生和家长，负责把底座组织成可持续使用的体验：

诊断地图。
生成式交互讲解。
兴趣定制呈现。
题目练习与提示。
掌握状态与解锁。
费曼输出。
家长仪表盘与周报。

2.3 共创自进化层

共创层负责把老师、学生、志愿者和 AI Agent 的贡献纳入稳定流程：

Feature Request / Bug Report。
内容草稿生成。
学科老师审核。
Staging 与 Canon 分区。
AI 自动实现局部改动。
人工 review 后上线。

学生侧永远只看到 Canon 稳定版。

3. 学习体验主循环

3.1 诊断起点

首次进入某条学习主线时，系统不从年级头灌，而是用少量自适应题定位起点。

设计要求：

题量控制在几分钟内完成。
题目覆盖关键前置知识，而不是平均覆盖全章。
对乱答、秒点、连续异常作答做识别。
输出“已掌握 / 薄弱 / 建议从哪里开始”的地图。
支持中途退出后继续接上。

3.2 知识原子

每个学习单元对应一个知识原子。知识原子至少包含：

节点 ID。
名称。
所属主线。
前置依赖。
年级与课标。
难度。
学习目标。
常见错因。
可用交互模板。
可用题型。
掌握判定标准。
费曼出口提示。

知识原子的粒度要足够小，使系统能诊断、练习、反馈和补救，而不是只知道“代数很差”。

3.3 AI 生成式交互

生成式交互是产品心脏，但它不能裸奔。每次生成都应受到知识原子、交互模板、兴趣连接库和数学校验的约束。

运行流程：

输入知识原子、学生画像、当前错因、兴趣偏好。
检索 verified 兴趣-学科连接。
选择交互模板或生成新交互草稿。
校验数学表达、边界条件和答案。
渲染给学生。
记录学生操作和理解状态。

降级规则：

生成超时：切换到标准交互或视频+题库。
校验失败：不得展示，重新生成或降级。
无兴趣连接：回到中性严谨呈现。
设备能力不足：切到轻量交互或文本+图示。

3.4 护栏式练习

练习环节遵循“AI 永不直接给答案”的架构级约束。

提示梯度：

复述学生当前思路。
定位错误类型。
给方向性提示。
要求学生再试。
苏格拉底追问关键变量或关系。
拆成更小步骤，但每步仍由学生完成。
仍失败时，切换讲法或换题，不无限追问。

系统需要区分三种失败：

概念不懂：回到交互讲解或样例。
计算错误：给局部计算提示和自动验答。
题意理解错误：引导画图、列变量、重述问题。

3.5 掌握判定

掌握判定不能只看一题是否答对。建议由四个信号组成：

正确率：达到阈值。
独立性：少提示或无提示完成。
迁移性：能做变式题。
解释性：能用自己的话讲清楚。

具体阈值仍待 L0 知识架构师确认。默认建议先采用可调参数，而不是写死到产品逻辑中。

3.6 费曼出口

每个关键知识原子完成后，系统要求学生讲给 AI 听。

设计要求：

v1 先支持文字输入。
AI 扮演“听不懂的同学”，追问含糊处。
追问聚焦概念关系，不纠缠表达风格。
费曼输出结果进入掌握判定，但不直接作为唯一凭据。
允许学生二次改写，形成可见进步。

4. 游戏化与动机设计

本项目的游戏化不是积分、徽章、皮肤的堆叠，而是把学习组织成有目标、有反馈、有挑战、有成长感的过程。

4.1 关卡结构

每个知识原子可以设计为一个关卡：

开场挑战：一个让学生意识到问题的情境。
交互探索：拖拽、选择、构造、观察。
关键发现：学生自己说出规律。
练习巩固：从带提示到少提示。
掌握检查：独立完成变式。
解释出口：讲给 AI 或同伴听。

4.2 必要难度

学习体验需要有“刚好难”的设计：

太简单：学生只是滑过去，没有学习增益。
太难：学生进入挫败，放弃。
合适：学生需要思考，但能在提示下前进。

系统应把困难变成可恢复的挑战，而不是死路。

4.3 正向反馈

反馈要具体，不要空泛夸奖。

好的反馈：

“你把两个未知量都设出来了，下一步只差把数量关系写成方程。”
“这次你没有直接猜答案，而是先画了关系图，这是进步。”

不好的反馈：

“太棒了！”
“再试试。”

4.4 兴趣定制

兴趣定制只服务理解和动机，不改变知识目标。

三类连接：

情境包装：题目背景换成孩子熟悉的场景。
概念类比：用兴趣机制解释抽象关系。
视觉皮肤：界面和角色风格调整。

概念类比风险最高，必须经过学科审核。

5. 学科设计

5.1 数学 v1

v1 建议继续聚焦初中代数主线，原因是：

知识依赖清晰，适合知识图谱。
自动验答可行，能控制 AI 幻觉。
错因类型相对可枚举。
掌握式学习价值明显。

数学学习目标不止是会算，还包括：

把现实问题转化为数学表达。
知道变量、关系、方程分别是什么。
能判断答案是否合理。
能解释自己为什么这样列式。

5.2 英语 v1.1 候选

英语适合作为快速跟进，但不建议抢 v1 主线资源。

可迁移机制：

Read Aloud 作为低门槛入口。
AI 发音反馈。
可理解输入。
低焦虑输出。
Door Check / 掌握检查。
家长或教师端进度可见。

英语的关键风险是双重认知负荷。弱基础学生同时处理内容理解和语言形式时容易崩溃，因此主题要简单、语言密度要可控。

5.3 项目工作室与学科副本

“AI 学科副本”适合体现超脑特色：学生不是只在题目里证明自己会了，而是在真实问题、跨学科情境和项目作品里证明自己能迁移。

示例：

给视障跑者设计提醒系统。
给家人设计健康饮食助手。
做一个茶文化小游戏。

系统把真实问题拆出相关学科知识、AI 工具、设计思维和表达任务。学生最终完成作品，而不仅是做题。

项目化、跨学科、同伴互教和学生主动构建概念图的完整形态见 learning-methods-expansion.md。核心边界是：项目必须回到知识节点、掌握证据和迁移证据，而不是只提升作品热闹感。

6. 家长仪表盘

家长仪表盘的定位是鼓励式问责，不是监控。

6.1 核心问题

家长只需要回答四个问题：

学到哪了？
有没有漏？
是不是在认真学？
现在卡在哪里，下一步怎么帮？

6.2 页面模块

学习地图：主线位置与已掌握节点。
掌握热力图：红黄绿显示薄弱点。
投入趋势：本周时长、连续天数、活跃变化。
卡点摘要：最近反复失败的概念或题型。
一键鼓励：家长向孩子发送鼓励。
周报推送：微信或邮件发送自然语言摘要。

6.3 隐私边界

默认展示成长和建议，不展示羞辱性排行。
孩子知道哪些信息对家长可见。
家长只读，不能替孩子做题、改进度或跳过掌握检查。

7. 内容与共创机制

7.1 分层角色

L0 知识架构师：定义主线、标准和质量门。
L1 学科负责人：审核与 Merge，权力不可绕过。
L2 内容贡献者：生成或编辑题目、讲解、类比。
L3 审核志愿者：勘误、标注、二审。
L4 学习者社区：提交难度反馈、错题解释、类比建议。

7.2 内容状态

Draft：AI 或贡献者生成草稿。
Staging：已提交审核，未对学生开放。
Canon：已审核稳定版，可进入学生侧。
Deprecated：已被替换，但保留历史。

7.3 元数据

每个内容单元必须带：

知识点 ID。
年级。
难度。
课标。
贡献者。
审核者。
版本。
适用场景。
常见错因。
相关兴趣连接。

7.4 作者不审自己内容

任何进入 Canon 的内容都必须经过非作者审核。AI 生成内容也视为“作者”为 AI/提交者，不得自动上线。

8. 系统质量门

8.1 数学正确性

所有数学答案、等价变换、提示中的关键判断必须校验。
校验失败不得展示给学生。
对无法自动校验的开放解释，至少要经过规则检查和人工抽检。

8.2 生成稳定性

每个知识原子必须有标准兜底路径。
生成式内容失败不能中断学习。
热门节点应支持缓存或预生成。

8.3 学习效果

不只看完成率，要看掌握率。
不只看平台内正确率，要看撤掉 AI 后的迁移测试。
不只看孩子是否喜欢，要看是否能解释。

9. v1 里程碑映射

M1 知识图谱 + 诊断

建立初中代数主线知识原子。
实现诊断题流。
接入数学自动验答。
输出起点地图。

M2 心脏 + 护栏

实现至少 2-3 个核心知识原子的生成式交互。
实现护栏式提示流。
建立视频+题库兜底。
建立兴趣连接种子库。

M3 闭环 + 留存

实现掌握判定。
实现费曼出口。
实现家长仪表盘与周报。

M4 验证

找 10-20 名学生封闭测试。
观察次日/7 日留存、单次学习时长、掌握率、迁移测试结果。
整理 3 个学习案例。

10. 待决策事项

掌握判定阈值由谁定，以及初始阈值是多少。
诊断题量上限和首次体验时长目标。
家长可见信息的隐私默认值。
兴趣连接库的首批兴趣范围。
教师共创在 v1 是产品内功能，还是先用 GitHub/表单/Issue 流承接。