AI 版可汗学院 — 知识连接、跨学科与项目化学习设计备忘

1. 一句话结论

这些方向可以做，而且和项目气质很一致；但它们不应该被做成一堆彼此独立的新功能。

更稳的做法是把它们统一成一条产品原则：

学生不仅要学会一个知识点，还要能解释它、连接它、迁移它，并用它完成一个小作品或真实任务。

因此，最终形态不是在原来的学习流旁边再加一个“项目区”或“社交区”，而是形成两条互相咬合的循环：

掌握循环：知识图谱 -> 学生先尝试 -> 护栏式提示 -> 掌握判定 -> 费曼解释
连接循环：概念关系 -> 跨学科情境 -> 同伴互教 -> 项目作品 -> 迁移证据

⚠️ 重要前提：这七种方法的证据强度和落地难度差异极大，不能等量齐观。费曼、组块化自适应、知识图谱已经在 v1 闭环里且证据扎实；而拼图教学法最严格的 RCT 全为零效果、联通主义几乎没有实证、AI 给综合项目打分目前只有约 59% 可靠。建议先读 §15 的证据分级表，再读下面的愿景部分——否则容易把"理念上能融合"误读成"七个都现在就能做"。

2. 对用户动机的分析

你提出这组方法，背后不是简单想“多加几个学习法”。更像是在追问：AI 版可汗学院能不能不要只把孩子训练成会刷题的人，而是帮助他们形成更完整的学习能力。

我理解你的动机有五层：

反刷题化：你不满足于“题做对了”，你关心孩子是否真的理解知识之间的关系，能不能迁移到新情境。
反被动学习：你想让学生从看讲解、听 AI、做题，转向自己解释、自己建图、自己做项目。
反孤立学习：你担心纯 AI tutor 会把孩子关在一对一对话里，所以提出拼图教学、同伴互教、上传作品，让学习重新有“人和人”的连接。
保留超脑特色：你希望这个项目不是 Khan Academy 的 AI 版复刻，而是把项目制、真实问题、创造力、AI 原生作品产出带进公益教育。
服务弱资源孩子但不降低上限：目标用户是缺资源的孩子，但你不想给他们低配教育；你想让他们也能接触到过去只有好学校、项目制学校、创新营才有的学习体验。

这里有一个张力：这些方向越完整，越接近一个“AI 原生项目制学校”；但这个学校仍然不能放弃“真的学会”的硬约束。最终形态应当是：自由探索看起来很开放，底层却一直由知识图谱、掌握证据、过程证据和审核机制兜住。

还有两点值得点破：

你其实在赌“AI 原生能消除协作与批改成本”。 拼图互教、跨学科生成、项目化 + 逐一评价，在传统课堂里之所以稀缺，是因为它们需要大量老师、同伴和批改人力。你提这一组，本质是押注：AI 把“协作与批改成本”压到接近零，于是过去只有好学校、项目制学校、创新营才负担得起的学习方式，可以平价地给到缺资源的孩子。这跟项目“千人千面、算力赞助”的主张是同一个底层逻辑——逻辑成立。
但要警惕你自己的兴奋。 一次性列七种方法，正好撞上 v1“一条数学主线 + KISS”的克制原则（learning-principles §9 的七问、§10 的“先闭环再扩展”）。动机是对的，风险全在排序——把“该做”误当成“现在就做”。所以这份备忘真正的价值不在证明“能做”，而在把“什么时候做、做到什么程度”分清楚（见 §15–§16）。

3. 最终产品形态

如果把这些方法整体放进去，AI 版可汗学院最终不是“AI 老师 + 题库”，而是一个由五个系统组成的 AI 原生自学平台。

子系统	学生看到什么	系统实际做什么
掌握引擎	学习地图、关卡、提示、复测、费曼解释	管知识原子、前置依赖、错因、提示层级、掌握判定
个人概念图	自己画出的知识网络、补边任务、连接解释	记录学生如何理解概念关系，识别断裂和误连
跨学科连接库	科学、历史人物、工程、生活问题里的知识连接	把兴趣和真实世界连接映射回知识节点，并做质量审核
项目工作室	项目任务、过程上传、里程碑、作品迭代	把项目拆成知识节点、过程证据、rubric 和迁移任务
互教与作品评价网络	讲给同伴听、收到反馈、修改作品、成长档案	做匹配、验答、反作弊、隐私控制、AI 初评和人工抽检

这五个系统的关系是：

Canon 知识图谱
  -> 学生个人概念图
  -> 跨学科连接任务
  -> 项目工作室
  -> 互教与作品反馈
  -> 新的掌握证据 / 误区证据 / 连接候选
  -> 回流给知识图谱与内容共创系统

学生感受到的是“我在做一个有意思的任务”；系统真正关心的是“这个任务证明了哪些知识已经掌握，哪些关系还没建立”。

4. 学生的一天会是什么样

一个学生进入平台，不是先看到课程目录，也不是先看到聊天框，而是看到自己的“学习地图”：

主线地图：哪些知识点已掌握、正在学、还未解锁。
个人概念图：自己已经建立了哪些概念关系。
今日任务：一个概念关卡、一个连接任务或一个项目里程碑。
成长证据：最近一次独立解题、费曼解释、项目修改、同伴反馈。

一次完整学习体验可以这样发生：

1. 系统推荐今日任务：用二元一次方程组解决一个真实情境。
2. 学生先尝试拆题：已知量、未知量、关系、方程、验算。
3. AI 只看学生已有尝试，给最小提示，不直接给答案。
4. 学生完成独立变式题，进入掌握检查。
5. 学生用自己的话做费曼解释。
6. 系统要求学生补一条概念图关系：这个知识点和哪个前置知识有关？
7. 系统给一个跨学科连接：例如历史人物如何用测量和方程解决实际问题。
8. 学生把解释或项目过程上传为作品草稿。
9. AI 给一条最重要修改建议，同伴只评价“哪里听懂/没听懂”。
10. 修改后的作品进入成长档案，并反向更新掌握证据。

这里的游戏化不是积分商城，而是“任务、关卡、解锁、作品、反馈、成长档案”。奖励对象不是刷题数量，而是高质量行为：独立尝试、修正错误、讲清关系、完成迁移、认真修改。

5. 三张图谱

最终形态至少需要三张相互关联的图。

5.1 Canon 知识图谱

这是官方知识结构，由学科负责人维护。它定义：

知识原子。
前置依赖。
课标与年级。
常见错因。
可验题型。
掌握标准。
可用连接与项目。

Canon 图谱决定系统推荐路径，学生不能直接修改。

5.2 学生个人概念图

这是学生自己的理解网络。它记录：

学生认为两个知识点是什么关系。
学生能不能解释这条关系。
这条关系是正确、含糊、牵强，还是明显错误。
学生在哪些概念之间反复误连。
哪些兴趣或真实问题最能帮助他理解。

学生个人概念图不是装饰，而是掌握证据的一部分。一个孩子如果能稳定说清“为什么方程组依赖一元一次方程”“为什么交点对应共同解”，说明他不是只会套步骤。

5.3 项目与连接图谱

项目、历史人物、科学案例、工程任务、生活问题也要进图谱，但不是作为泛泛素材库，而是作为“连接节点”。

例如：

历史人物：祖冲之
连接主题：圆周率、近似、误差、测量
可连接知识：比例、估算、极限思想前置、数据精度
适用任务：解释为什么近似值有用；比较不同精度的计算影响
审核状态：verified

这能避免跨学科学习变成随手编故事。每个跨学科连接都要知道：它到底帮助理解哪个知识点。

6. 七种学习法如何融合

方法	最终系统里的位置	具体机制
联通主义	整个平台的底层结构	学习被组织成知识、人、资源、项目、作品之间的连接网络，但连接必须可追踪、可审核
西蒙学习法	解题与项目拆解界面	所有复杂任务先拆成目标、已知、未知、约束、子问题、反馈，再逐步求解
费曼学习法	掌握出口和互教入口	学生必须用自己的话解释，AI 和同伴追问含糊处，解释质量进入掌握证据
拼图教学法	同伴互教网络	每个学生负责一个子概念或子任务，系统先验答关键内容，再组织互教和拼合
主动构建知识图谱	个人概念图	学生补关系边、解释关系、修正误连，形成自己的理解网络
跨学科学习	连接库与项目任务	历史、科学、工程、生活情境作为 verified 连接节点，必须回收到知识点
项目化学习	项目工作室	项目由真实问题驱动，但每个里程碑都绑定知识节点、过程证据和评价 rubric

它们不是七个入口，而是一条递进关系：

拆解问题 -> 掌握知识 -> 解释知识 -> 连接知识 -> 教给别人 -> 用于项目 -> 反思修正

7. 项目工作室设计

项目工作室是最终形态里最能体现差异化的模块，但它必须被设计成“掌握后的迁移场”，不是绕开基础学习的游乐场。

每个项目都包含：

project_id
driving_question
story_context
knowledge_nodes
prerequisites
milestones
required_artifacts
process_evidence
rubric
ai_feedback
peer_feedback
human_review_state
visibility

项目过程分为五步：

选择问题：系统根据学生已掌握节点推荐真实问题或跨学科主题。
拆解任务：学生把项目拆成子问题，AI 检查是否漏掉关键约束。
学习补洞：遇到未掌握知识，系统拉回对应知识原子学习。
上传过程：草稿、推导、截图、视频、代码、讲解都可以成为过程证据。
评价修改：AI 给形成性建议，同伴反馈理解度，老师抽样或审核高价值作品。

项目完成不等于掌握。项目只能增加迁移证据，最终仍要看独立题、解释质量、延迟复测和项目中的关键知识片段。

8. 互教与拼图教学设计

拼图教学的核心不是“开聊天室”，而是“让学生承担一小块可验证的解释责任”。

推荐机制：

系统把一个大主题拆成 3-5 个子概念。
每个学生负责一个子概念，先完成自己的掌握检查。
学生提交一张“互教卡”：概念解释、例子、常见误区、一个检查问题。
AI 先验答互教卡中的数学和事实错误。
小组成员阅读或听讲后，只回答三个问题：哪里听懂了，哪里没听懂，哪个例子有帮助。
系统要求原作者根据反馈修改一次。

互教的评价重点不是“谁讲得最厉害”，而是：

能否讲清关键关系。
能否根据别人听不懂的地方修改。
是否暴露并修正自己的误区。
是否帮助同伴形成正确理解。

所有互教内容默认私密或小组可见，公开展示需要审核。

9. AI 评价设计

AI 评价应该像教练，不像裁判。

AI 可以评价：

正确性：关键数学步骤是否成立。
清晰度：解释是否让低年级同学能听懂。
关系性：是否说清前置知识、相似概念和区别。
迁移性：是否能把知识用于新情境。
反思性：是否能指出自己哪里改进了。
过程性：是否有草稿、修改、重试和证据。

AI 不应单独决定：

作品是否公开展示。
学生是否获得高风险能力标签。
开放项目是否最终掌握。
同伴反馈是否完全有效。
涉及心理、家庭、升学的判断。

最终评价应分成三层：

层级	评价者	用途
自动验答	符号计算 / 规则引擎	判断数学关键步骤是否正确
AI 形成性反馈	LLM + rubric	给修改建议、发现表达漏洞、归类误区
人工抽检/审核	老师 / 志愿者 / 学科负责人	审核公开作品、高价值连接、跨学科任务和争议评价

10. 成长档案

最终产品应为每个学生生成一个“成长档案”，但它不是成绩单。

它记录四类证据：

掌握证据：独立题、变式题、延迟复测、提示依赖度。
解释证据：费曼解释、互教卡、二次改写。
连接证据：个人概念图、跨学科连接、类比解释。
创造证据：项目作品、过程上传、修改记录、同伴反馈。

家长和老师看到的不是“孩子今天刷了多少题”，而是：

他真正掌握了哪些知识。
哪些概念关系开始建立。
哪些误区反复出现。
他有没有从“听懂”走向“讲清”和“用出来”。
哪些作品证明了他的理解和创造。

11. 产品模块清单

最终形态可以拆成这些模块：

模块	作用
学习地图	展示 Canon 知识图谱和个人进度
今日任务引擎	在概念关卡、连接任务、项目里程碑之间推荐下一步
护栏式 AI Tutor	基于学生尝试给提示，不直接给答案
问题拆解器	引导学生拆目标、已知、未知、关系、约束和子问题
费曼出口	让学生讲给 AI 或同伴听，并接受追问
个人概念图	让学生补边、解释关系、修正误连
跨学科连接库	管理科学、历史、工程、生活情境和知识点的 verified 连接
项目工作室	管项目任务、过程上传、里程碑、作品和修改
互教工坊	管拼图教学、互教卡、同伴理解反馈
AI 评价器	做 rubric 初评、修改建议、误区归类
人工审核台	审核公开作品、高价值连接、跨学科项目和争议反馈
成长档案	汇总掌握、解释、连接、创造四类证据

12. 系统边界

把这些方法放进整体设计后，边界更重要。

必须坚持：

连接必须服务理解，不服务炫技。
项目必须回到知识节点，不允许项目制空转。
同伴互教必须先经过关键内容验答，不允许互相喂答案。
AI 评价必须以修改建议为主，不以排名和标签为主。
成长档案必须保护隐私，不把未成年人作品默认公开。
跨学科素材只参考事实、框架和知识连接，不直接搬用他人内容。

13. 一个具体例子

主题：二元一次方程组。

传统做法是讲代入法、加减消元法，然后刷题。整体设计下可以这样做：

知识关卡：
学生先解决一个两种票价、总人数和总收入的问题。
AI 引导他拆出未知量、两个关系和两个方程。

费曼解释：
学生解释“为什么两个方程的共同解才是答案”。

个人概念图：
学生补边：一元一次方程 -> 二元一次方程组。
解释：以前只有一个未知量，现在有两个未知量，所以需要两个独立关系。

跨学科连接：
系统给出一个科学史/工程测量情境：用两个观测关系确定两个未知参数。
学生判断这个情境和方程组有什么相同、有什么不同。

拼图互教：
小组中一人负责“设未知量”，一人负责“列关系”，一人负责“消元”，一人负责“验算与解释”。
每人提交互教卡，AI 先验答关键数学。

项目任务：
设计一个校园义卖定价方案：两种商品、总销量、总收入、目标利润。
学生上传草稿、方程、验算、最终说明。

AI 评价：
AI 指出“你的方程成立，但没有解释为什么两个关系独立”。
学生修改后进入成长档案。

这个例子里，学生不是在“玩项目”逃避数学，而是在用项目证明自己理解了数学。

14. 仍需拍板的问题

“西蒙学习法”在本项目中是否正式定义为“问题拆解 + 组块练习 + 反馈迭代”，避免使用含混说法？
学生个人概念图在掌握判定中占多大权重？
跨学科连接是否先由老师共创 verified 库，还是允许学生提交 pending 连接？
项目作品默认可见范围是什么：仅自己、家长、同伴小组、老师，还是公开？
AI 评价的语气和权限如何约束，避免学生把 AI 分数当作自我价值判断？
拼图互教是否允许同步语音/视频，还是只做异步互教卡？
成长档案是否面向升学展示，还是只面向学习过程反馈？

15. 证据分级与可行性评估（关键修正）

本节是对前面愿景部分的“证据底座”修正。前面把七种方法当作一个融洽的整体来描述，但从学习科学证据和“单人 + AI”落地难度看，它们差异极大。下表是决策依据，带反驳/风险来源，区分“已验证事实”与“推测”。

方法	学习科学证据强度	单人 + AI 可行性	建议进入阶段	最大的坑（含反驳/风险来源）
费曼学习法	中–强：自我解释元分析显著（Bisra 2018）；Protégé/可教代理效应（Chase 2009）	极高（七法最高）	已在 v1（FR-6 费曼出口）	低龄/初学者“假懂”（Dunning-Kruger）；学生方向性错误时只追问不纠偏会固化错误；每题都走费曼会认知过载，须策略性触发（只对核心概念/易混点）
西蒙学习法（组块 + 刻意练习）	中：刻意练习仅解释约 19% 绩效方差（Macnamara 2014, N=11,135）；“任意学科 6 个月可掌握”是对原文的断章取义	高	已在 v1（FR-1/FR-2 自适应 + 掌握判定）	别用“西蒙学习法/6 个月”这种含混营销话术；错误组块一旦固化极难纠正
主动构建知识图谱	中–强：概念图 g=0.72、主动构建 > 被动阅读 g=0.43（Adesope 2017, N=11,814），叠加生成效应	中	v1.x（从“掌握图谱可视化 + AI 验证补边”起步）	map shock / 认知负荷；易退化成“画图作业”；不要让学生从零画图，AI 给骨架、学生补 1–3 条边
跨学科学习	中–强：STEM 整合 g=0.661（Zhou 2025, 40 研究）；且对齐 2022 新课标 + 2024 中考情境化命题（反而是刚需）	高	v1.x（掌握后可选“延伸关联卡片”，标注对应情境化题型）	“浅层关联牺牲学科严密性”批评（Benson 1982；Indian Express 2024）；须守住“主线掌握优先、跨学科为可选延伸”
项目化学习（PBL）	中–强：d≈0.88（多元分析汇总）、动机 d=0.498；但对新手须强支架（Kirschner 2006 警告无结构探索伤新手）	中（须“先掌握再项目化” + 里程碑掌握闸）	v2（项目工作室）	对弱基础学生不给支架 = 把人推进深水池；项目制空转、用项目逃避数学
拼图教学法	弱/矛盾：旧元分析 g=0.77，但 Stanczak 2022 五项 RCT 全部 ES=0.00	中（须改造，不建议作核心路径）	v2，且只作费曼/互教的变体	单人场景丢失“社会互依”动机；强行拆数学知识拓扑很危险；AI 扮同学易角色混乱
联通主义	几乎无实证：无 RCT、无可靠效应量、缺可操作教学设计	低	仅作设计理念，不立为教学法	预设高信息素养，初高中生缺“存量节点”无从建连；连接必须可追踪可审核，否则是空话

AI 评价与游戏化的硬约束（决定项目工作室能不能做、怎么做）：

AI 评价语言类 + 有 rubric 的任务已达中等可靠：o1 作文评分与人类 r=.74、ICC=.80（arXiv 2411.16337），可用于低风险形成性反馈——但所有模型都有“打高分”通胀偏向。
AI 评价综合创意项目目前不可靠：专项基准 PBLBench 显示最优模型排名准确率仅 59%，对不完整报告仍持续给高分（arXiv 2505.17050）。结论：AI 只做形成性建议 + rubric 初评，绝不独立做终结性评分——这与护栏“AI 不替代最终判定”完全一致（呼应 §9）。
游戏化必须分清两类：成就型/能力确认徽章安全且小幅正向（Frontiers 2024, g=0.257）；而打卡型/完成型奖励 + 绝对排行榜会侵蚀内在动机（Deci 1999, d≈-0.40），对弱基础学生伤害最大——应在架构层排除（与 learning-principles §8.1 一致）。

16. 分阶段引入建议

把上表翻译成路线图，核心是克制：不是七个一起上，而是按“证据强度 × 落地成本 × 对 v1 闭环的增益”排序。

底座（v1 已含，不是新功能）：费曼出口（FR-6）、组块化自适应与掌握判定（FR-1/FR-2）、Canon 知识图谱可视化（FR-1 + 家长仪表盘学习地图）。先把这条主线闭环跑通、拿到双主指标，再谈扩展。
近期可低成本叠加（v1.x，与中国刚需强对齐）： 1. 个人概念图——“AI 给骨架 + 学生补 1–3 条边 + 苏格拉底验边 + 验过才更新掌握权重”； 2. 跨学科“延伸关联卡片”——掌握某知识点后可选触发，每条连接显式标注“对应中/高考情境化题型”，消除家长偏科焦虑。
中后期（v2，重投入 + 高风险，需前置条件）：项目工作室 + 互教工坊 + AI 作品评价器 + 人工审核台。前置条件：① 有足够真实用户量支撑真人配对（否则互教只能靠 AI 假同伴，信任打折）；② 志愿者审核产能可持续；③ AI 综合评价可靠性提升到可用。
仅作设计理念、不单独立项：联通主义——它的价值是提供“学习 = 一张可审核的知识/人/资源/作品连接网络”这一架构隐喻，指导前面三张图谱的设计即可，不要把它当成一种要交给学生用的“学习法”。

17. 新增待决问题（排序与边界）

§14 已列了 7 个偏“机制细节”的问题；这里补 6 个偏“排序与边界”、更上层的问题：

排序与克制：除已在 v1 的费曼/组块/知识图谱外，其余方向在“跑通闭环、拿到双主指标”之前是否一律不碰？引入新方向是否就用 learning-principles §9 的七问做闸门？
AI 模拟同伴 vs 真人：拼图/互教在没有真实用户量时，是用 AI 扮同伴，还是直接延后到能做真人配对？（研究提示教师/同伴的“社会临场感”对学习与信任很关键，AI 假同伴用不好会降低信任）需要一个“何时切到真人”的明确触发条件。
应试 vs 素养张力：跨学科、项目化是素养路线，但目标用户的刚需往往是中高考提分。家长会不会觉得“不务正业”？如何把跨学科/项目显性挂钩“情境化命题”（这已是中考趋势），让它既练素养又服务刚需？
认知负荷预算：一个 10–12 分钟短闭环已含“尝试 → 错因 → 提示 → 再试 → 独立复做 → 费曼 → 延迟复测”。再叠加补边、跨学科、项目，每天“认知预算”如何分配？哪些每日必做、哪些走周节奏或可选？
内在动机红线：项目上传 + AI 评价 + 徽章，如何保证只奖励“高质量行为”（独立尝试、修错、讲清、迁移），而不退化成“完成打卡得分 / 绝对排行榜”这类已被证实侵蚀内在动机的设计？
AI 评价的护栏一致性：护栏原则是“AI 不给答案”；那“AI 评价/打分作品”在精神上是否一致？当 AI 综合评价不可靠（约 59%）时由谁兜底？公益项目的人工抽检产能从哪里来、如何排队？

18. 来源

完整调研见 ../research/ 下三份报告（四种学习法 / 知识图谱与跨学科 / 项目化与 AI 评价）。关键来源：

费曼/自我解释：Bisra et al. 2018 元分析 — https://gwern.net/doc/psychology/spaced-repetition/2018-bisra.pdf
Protégé 效应：Chase et al. 2009（Stanford）— https://aaalab.stanford.edu/assets/papers/2009/Protege_Effect_Teachable_Agents.pdf
刻意练习边界：Macnamara et al. 2014 — https://www.psychologie.uzh.ch/dam/jcr:658d39fe-2f4b-467f-9ae2-ffeb25caf2b6/McNamara.PsychSci.25.2014.pdf
概念图主动构建：Adesope et al. 2017 — https://link.springer.com/article/10.1007/s10648-017-9403-9
map shock / 认知负荷：Frontiers in Education 2022 — https://www.frontiersin.org/journals/education/articles/10.3389/feduc.2022.892312/full
STEM 跨学科整合：Zhou et al. 2025 — https://link.springer.com/article/10.1007/s11165-024-10216-y
中考情境化命题趋势（2024 广州）— https://wap.ycwb.com/2024-07/03/content_52784132.htm
跨学科“浅层关联”批评 — https://indianexpress.com/article/opinion/columns/true-interdisciplinary-education-must-have-depth-before-breadth-10365296/
拼图教学法 RCT 零效果：Stanczak 2022（ERIC）— https://eric.ed.gov/?id=EJ1372764
联通主义可行性质疑 — https://cdspress.ca/wp-content/uploads/2023/07/CALL-Connectivism_Langridge.pdf
PBL 效应量（Visible Learning MetaX）— https://www.visiblelearningmetax.com/influences/view/project-based_learning
新手需支架（Kirschner 2006 / scaffolded PBL）— https://link.springer.com/article/10.1007/s10648-023-09828-z
LLM 作文评分一致性：arXiv 2411.16337 — https://arxiv.org/html/2411.16337
AI 评 PBL 项目不可靠：PBLBench，arXiv 2505.17050 — https://arxiv.org/html/2505.17050
外在奖励侵蚀内在动机：Deci, Koestner & Ryan 1999 — https://pubmed.ncbi.nlm.nih.gov/10589297/
成就型徽章正向：Frontiers in Education 2024 — https://www.frontiersin.org/journals/education/articles/10.3389/feduc.2024.1429452/full
排行榜对低成绩学生负效应 — https://link.springer.com/article/10.1007/s11423-023-10337-7
产品参考：Sora Schools “Goodbye Grades” — https://trends.soraschools.com/goodbye-grades ；Feynman AI — https://feynmanai.net/