AI 版可汗学院 — 知识连接、跨学科与项目化学习设计备忘
1. 一句话结论
这些方向可以做,而且和项目气质很一致;但它们不应该被做成一堆彼此独立的新功能。
更稳的做法是把它们统一成一条产品原则:
学生不仅要学会一个知识点,还要能解释它、连接它、迁移它,并用它完成一个小作品或真实任务。
因此,最终形态不是在原来的学习流旁边再加一个“项目区”或“社交区”,而是形成两条互相咬合的循环:
掌握循环:知识图谱 -> 学生先尝试 -> 护栏式提示 -> 掌握判定 -> 费曼解释
连接循环:概念关系 -> 跨学科情境 -> 同伴互教 -> 项目作品 -> 迁移证据
⚠️ 重要前提:这七种方法的证据强度和落地难度差异极大,不能等量齐观。费曼、组块化自适应、知识图谱已经在 v1 闭环里且证据扎实;而拼图教学法最严格的 RCT 全为零效果、联通主义几乎没有实证、AI 给综合项目打分目前只有约 59% 可靠。建议先读 §15 的证据分级表,再读下面的愿景部分——否则容易把"理念上能融合"误读成"七个都现在就能做"。
2. 对用户动机的分析
你提出这组方法,背后不是简单想“多加几个学习法”。更像是在追问:AI 版可汗学院能不能不要只把孩子训练成会刷题的人,而是帮助他们形成更完整的学习能力。
我理解你的动机有五层:
- 反刷题化:你不满足于“题做对了”,你关心孩子是否真的理解知识之间的关系,能不能迁移到新情境。
- 反被动学习:你想让学生从看讲解、听 AI、做题,转向自己解释、自己建图、自己做项目。
- 反孤立学习:你担心纯 AI tutor 会把孩子关在一对一对话里,所以提出拼图教学、同伴互教、上传作品,让学习重新有“人和人”的连接。
- 保留超脑特色:你希望这个项目不是 Khan Academy 的 AI 版复刻,而是把项目制、真实问题、创造力、AI 原生作品产出带进公益教育。
- 服务弱资源孩子但不降低上限:目标用户是缺资源的孩子,但你不想给他们低配教育;你想让他们也能接触到过去只有好学校、项目制学校、创新营才有的学习体验。
这里有一个张力:这些方向越完整,越接近一个“AI 原生项目制学校”;但这个学校仍然不能放弃“真的学会”的硬约束。最终形态应当是:自由探索看起来很开放,底层却一直由知识图谱、掌握证据、过程证据和审核机制兜住。
还有两点值得点破:
- 你其实在赌“AI 原生能消除协作与批改成本”。 拼图互教、跨学科生成、项目化 + 逐一评价,在传统课堂里之所以稀缺,是因为它们需要大量老师、同伴和批改人力。你提这一组,本质是押注:AI 把“协作与批改成本”压到接近零,于是过去只有好学校、项目制学校、创新营才负担得起的学习方式,可以平价地给到缺资源的孩子。这跟项目“千人千面、算力赞助”的主张是同一个底层逻辑——逻辑成立。
- 但要警惕你自己的兴奋。 一次性列七种方法,正好撞上 v1“一条数学主线 + KISS”的克制原则(learning-principles §9 的七问、§10 的“先闭环再扩展”)。动机是对的,风险全在排序——把“该做”误当成“现在就做”。所以这份备忘真正的价值不在证明“能做”,而在把“什么时候做、做到什么程度”分清楚(见 §15–§16)。
3. 最终产品形态
如果把这些方法整体放进去,AI 版可汗学院最终不是“AI 老师 + 题库”,而是一个由五个系统组成的 AI 原生自学平台。
| 子系统 | 学生看到什么 | 系统实际做什么 |
|---|---|---|
| 掌握引擎 | 学习地图、关卡、提示、复测、费曼解释 | 管知识原子、前置依赖、错因、提示层级、掌握判定 |
| 个人概念图 | 自己画出的知识网络、补边任务、连接解释 | 记录学生如何理解概念关系,识别断裂和误连 |
| 跨学科连接库 | 科学、历史人物、工程、生活问题里的知识连接 | 把兴趣和真实世界连接映射回知识节点,并做质量审核 |
| 项目工作室 | 项目任务、过程上传、里程碑、作品迭代 | 把项目拆成知识节点、过程证据、rubric 和迁移任务 |
| 互教与作品评价网络 | 讲给同伴听、收到反馈、修改作品、成长档案 | 做匹配、验答、反作弊、隐私控制、AI 初评和人工抽检 |
这五个系统的关系是:
Canon 知识图谱
-> 学生个人概念图
-> 跨学科连接任务
-> 项目工作室
-> 互教与作品反馈
-> 新的掌握证据 / 误区证据 / 连接候选
-> 回流给知识图谱与内容共创系统
学生感受到的是“我在做一个有意思的任务”;系统真正关心的是“这个任务证明了哪些知识已经掌握,哪些关系还没建立”。
4. 学生的一天会是什么样
一个学生进入平台,不是先看到课程目录,也不是先看到聊天框,而是看到自己的“学习地图”:
- 主线地图:哪些知识点已掌握、正在学、还未解锁。
- 个人概念图:自己已经建立了哪些概念关系。
- 今日任务:一个概念关卡、一个连接任务或一个项目里程碑。
- 成长证据:最近一次独立解题、费曼解释、项目修改、同伴反馈。
一次完整学习体验可以这样发生:
1. 系统推荐今日任务:用二元一次方程组解决一个真实情境。
2. 学生先尝试拆题:已知量、未知量、关系、方程、验算。
3. AI 只看学生已有尝试,给最小提示,不直接给答案。
4. 学生完成独立变式题,进入掌握检查。
5. 学生用自己的话做费曼解释。
6. 系统要求学生补一条概念图关系:这个知识点和哪个前置知识有关?
7. 系统给一个跨学科连接:例如历史人物如何用测量和方程解决实际问题。
8. 学生把解释或项目过程上传为作品草稿。
9. AI 给一条最重要修改建议,同伴只评价“哪里听懂/没听懂”。
10. 修改后的作品进入成长档案,并反向更新掌握证据。
这里的游戏化不是积分商城,而是“任务、关卡、解锁、作品、反馈、成长档案”。奖励对象不是刷题数量,而是高质量行为:独立尝试、修正错误、讲清关系、完成迁移、认真修改。
5. 三张图谱
最终形态至少需要三张相互关联的图。
5.1 Canon 知识图谱
这是官方知识结构,由学科负责人维护。它定义:
- 知识原子。
- 前置依赖。
- 课标与年级。
- 常见错因。
- 可验题型。
- 掌握标准。
- 可用连接与项目。
Canon 图谱决定系统推荐路径,学生不能直接修改。
5.2 学生个人概念图
这是学生自己的理解网络。它记录:
- 学生认为两个知识点是什么关系。
- 学生能不能解释这条关系。
- 这条关系是正确、含糊、牵强,还是明显错误。
- 学生在哪些概念之间反复误连。
- 哪些兴趣或真实问题最能帮助他理解。
学生个人概念图不是装饰,而是掌握证据的一部分。一个孩子如果能稳定说清“为什么方程组依赖一元一次方程”“为什么交点对应共同解”,说明他不是只会套步骤。
5.3 项目与连接图谱
项目、历史人物、科学案例、工程任务、生活问题也要进图谱,但不是作为泛泛素材库,而是作为“连接节点”。
例如:
历史人物:祖冲之
连接主题:圆周率、近似、误差、测量
可连接知识:比例、估算、极限思想前置、数据精度
适用任务:解释为什么近似值有用;比较不同精度的计算影响
审核状态:verified
这能避免跨学科学习变成随手编故事。每个跨学科连接都要知道:它到底帮助理解哪个知识点。
6. 七种学习法如何融合
| 方法 | 最终系统里的位置 | 具体机制 |
|---|---|---|
| 联通主义 | 整个平台的底层结构 | 学习被组织成知识、人、资源、项目、作品之间的连接网络,但连接必须可追踪、可审核 |
| 西蒙学习法 | 解题与项目拆解界面 | 所有复杂任务先拆成目标、已知、未知、约束、子问题、反馈,再逐步求解 |
| 费曼学习法 | 掌握出口和互教入口 | 学生必须用自己的话解释,AI 和同伴追问含糊处,解释质量进入掌握证据 |
| 拼图教学法 | 同伴互教网络 | 每个学生负责一个子概念或子任务,系统先验答关键内容,再组织互教和拼合 |
| 主动构建知识图谱 | 个人概念图 | 学生补关系边、解释关系、修正误连,形成自己的理解网络 |
| 跨学科学习 | 连接库与项目任务 | 历史、科学、工程、生活情境作为 verified 连接节点,必须回收到知识点 |
| 项目化学习 | 项目工作室 | 项目由真实问题驱动,但每个里程碑都绑定知识节点、过程证据和评价 rubric |
它们不是七个入口,而是一条递进关系:
拆解问题 -> 掌握知识 -> 解释知识 -> 连接知识 -> 教给别人 -> 用于项目 -> 反思修正
7. 项目工作室设计
项目工作室是最终形态里最能体现差异化的模块,但它必须被设计成“掌握后的迁移场”,不是绕开基础学习的游乐场。
每个项目都包含:
project_id
driving_question
story_context
knowledge_nodes
prerequisites
milestones
required_artifacts
process_evidence
rubric
ai_feedback
peer_feedback
human_review_state
visibility
项目过程分为五步:
- 选择问题:系统根据学生已掌握节点推荐真实问题或跨学科主题。
- 拆解任务:学生把项目拆成子问题,AI 检查是否漏掉关键约束。
- 学习补洞:遇到未掌握知识,系统拉回对应知识原子学习。
- 上传过程:草稿、推导、截图、视频、代码、讲解都可以成为过程证据。
- 评价修改:AI 给形成性建议,同伴反馈理解度,老师抽样或审核高价值作品。
项目完成不等于掌握。项目只能增加迁移证据,最终仍要看独立题、解释质量、延迟复测和项目中的关键知识片段。
8. 互教与拼图教学设计
拼图教学的核心不是“开聊天室”,而是“让学生承担一小块可验证的解释责任”。
推荐机制:
- 系统把一个大主题拆成 3-5 个子概念。
- 每个学生负责一个子概念,先完成自己的掌握检查。
- 学生提交一张“互教卡”:概念解释、例子、常见误区、一个检查问题。
- AI 先验答互教卡中的数学和事实错误。
- 小组成员阅读或听讲后,只回答三个问题:哪里听懂了,哪里没听懂,哪个例子有帮助。
- 系统要求原作者根据反馈修改一次。
互教的评价重点不是“谁讲得最厉害”,而是:
- 能否讲清关键关系。
- 能否根据别人听不懂的地方修改。
- 是否暴露并修正自己的误区。
- 是否帮助同伴形成正确理解。
所有互教内容默认私密或小组可见,公开展示需要审核。
9. AI 评价设计
AI 评价应该像教练,不像裁判。
AI 可以评价:
- 正确性:关键数学步骤是否成立。
- 清晰度:解释是否让低年级同学能听懂。
- 关系性:是否说清前置知识、相似概念和区别。
- 迁移性:是否能把知识用于新情境。
- 反思性:是否能指出自己哪里改进了。
- 过程性:是否有草稿、修改、重试和证据。
AI 不应单独决定:
- 作品是否公开展示。
- 学生是否获得高风险能力标签。
- 开放项目是否最终掌握。
- 同伴反馈是否完全有效。
- 涉及心理、家庭、升学的判断。
最终评价应分成三层:
| 层级 | 评价者 | 用途 |
|---|---|---|
| 自动验答 | 符号计算 / 规则引擎 | 判断数学关键步骤是否正确 |
| AI 形成性反馈 | LLM + rubric | 给修改建议、发现表达漏洞、归类误区 |
| 人工抽检/审核 | 老师 / 志愿者 / 学科负责人 | 审核公开作品、高价值连接、跨学科任务和争议评价 |
10. 成长档案
最终产品应为每个学生生成一个“成长档案”,但它不是成绩单。
它记录四类证据:
- 掌握证据:独立题、变式题、延迟复测、提示依赖度。
- 解释证据:费曼解释、互教卡、二次改写。
- 连接证据:个人概念图、跨学科连接、类比解释。
- 创造证据:项目作品、过程上传、修改记录、同伴反馈。
家长和老师看到的不是“孩子今天刷了多少题”,而是:
- 他真正掌握了哪些知识。
- 哪些概念关系开始建立。
- 哪些误区反复出现。
- 他有没有从“听懂”走向“讲清”和“用出来”。
- 哪些作品证明了他的理解和创造。
11. 产品模块清单
最终形态可以拆成这些模块:
| 模块 | 作用 |
|---|---|
| 学习地图 | 展示 Canon 知识图谱和个人进度 |
| 今日任务引擎 | 在概念关卡、连接任务、项目里程碑之间推荐下一步 |
| 护栏式 AI Tutor | 基于学生尝试给提示,不直接给答案 |
| 问题拆解器 | 引导学生拆目标、已知、未知、关系、约束和子问题 |
| 费曼出口 | 让学生讲给 AI 或同伴听,并接受追问 |
| 个人概念图 | 让学生补边、解释关系、修正误连 |
| 跨学科连接库 | 管理科学、历史、工程、生活情境和知识点的 verified 连接 |
| 项目工作室 | 管项目任务、过程上传、里程碑、作品和修改 |
| 互教工坊 | 管拼图教学、互教卡、同伴理解反馈 |
| AI 评价器 | 做 rubric 初评、修改建议、误区归类 |
| 人工审核台 | 审核公开作品、高价值连接、跨学科项目和争议反馈 |
| 成长档案 | 汇总掌握、解释、连接、创造四类证据 |
12. 系统边界
把这些方法放进整体设计后,边界更重要。
必须坚持:
- 连接必须服务理解,不服务炫技。
- 项目必须回到知识节点,不允许项目制空转。
- 同伴互教必须先经过关键内容验答,不允许互相喂答案。
- AI 评价必须以修改建议为主,不以排名和标签为主。
- 成长档案必须保护隐私,不把未成年人作品默认公开。
- 跨学科素材只参考事实、框架和知识连接,不直接搬用他人内容。
13. 一个具体例子
主题:二元一次方程组。
传统做法是讲代入法、加减消元法,然后刷题。整体设计下可以这样做:
知识关卡:
学生先解决一个两种票价、总人数和总收入的问题。
AI 引导他拆出未知量、两个关系和两个方程。
费曼解释:
学生解释“为什么两个方程的共同解才是答案”。
个人概念图:
学生补边:一元一次方程 -> 二元一次方程组。
解释:以前只有一个未知量,现在有两个未知量,所以需要两个独立关系。
跨学科连接:
系统给出一个科学史/工程测量情境:用两个观测关系确定两个未知参数。
学生判断这个情境和方程组有什么相同、有什么不同。
拼图互教:
小组中一人负责“设未知量”,一人负责“列关系”,一人负责“消元”,一人负责“验算与解释”。
每人提交互教卡,AI 先验答关键数学。
项目任务:
设计一个校园义卖定价方案:两种商品、总销量、总收入、目标利润。
学生上传草稿、方程、验算、最终说明。
AI 评价:
AI 指出“你的方程成立,但没有解释为什么两个关系独立”。
学生修改后进入成长档案。
这个例子里,学生不是在“玩项目”逃避数学,而是在用项目证明自己理解了数学。
14. 仍需拍板的问题
- “西蒙学习法”在本项目中是否正式定义为“问题拆解 + 组块练习 + 反馈迭代”,避免使用含混说法?
- 学生个人概念图在掌握判定中占多大权重?
- 跨学科连接是否先由老师共创 verified 库,还是允许学生提交 pending 连接?
- 项目作品默认可见范围是什么:仅自己、家长、同伴小组、老师,还是公开?
- AI 评价的语气和权限如何约束,避免学生把 AI 分数当作自我价值判断?
- 拼图互教是否允许同步语音/视频,还是只做异步互教卡?
- 成长档案是否面向升学展示,还是只面向学习过程反馈?
15. 证据分级与可行性评估(关键修正)
本节是对前面愿景部分的“证据底座”修正。前面把七种方法当作一个融洽的整体来描述,但从学习科学证据和“单人 + AI”落地难度看,它们差异极大。下表是决策依据,带反驳/风险来源,区分“已验证事实”与“推测”。
| 方法 | 学习科学证据强度 | 单人 + AI 可行性 | 建议进入阶段 | 最大的坑(含反驳/风险来源) |
|---|---|---|---|---|
| 费曼学习法 | 中–强:自我解释元分析显著(Bisra 2018);Protégé/可教代理效应(Chase 2009) | 极高(七法最高) | 已在 v1(FR-6 费曼出口) | 低龄/初学者“假懂”(Dunning-Kruger);学生方向性错误时只追问不纠偏会固化错误;每题都走费曼会认知过载,须策略性触发(只对核心概念/易混点) |
| 西蒙学习法(组块 + 刻意练习) | 中:刻意练习仅解释约 19% 绩效方差(Macnamara 2014, N=11,135);“任意学科 6 个月可掌握”是对原文的断章取义 | 高 | 已在 v1(FR-1/FR-2 自适应 + 掌握判定) | 别用“西蒙学习法/6 个月”这种含混营销话术;错误组块一旦固化极难纠正 |
| 主动构建知识图谱 | 中–强:概念图 g=0.72、主动构建 > 被动阅读 g=0.43(Adesope 2017, N=11,814),叠加生成效应 | 中 | v1.x(从“掌握图谱可视化 + AI 验证补边”起步) | map shock / 认知负荷;易退化成“画图作业”;不要让学生从零画图,AI 给骨架、学生补 1–3 条边 |
| 跨学科学习 | 中–强:STEM 整合 g=0.661(Zhou 2025, 40 研究);且对齐 2022 新课标 + 2024 中考情境化命题(反而是刚需) | 高 | v1.x(掌握后可选“延伸关联卡片”,标注对应情境化题型) | “浅层关联牺牲学科严密性”批评(Benson 1982;Indian Express 2024);须守住“主线掌握优先、跨学科为可选延伸” |
| 项目化学习(PBL) | 中–强:d≈0.88(多元分析汇总)、动机 d=0.498;但对新手须强支架(Kirschner 2006 警告无结构探索伤新手) | 中(须“先掌握再项目化” + 里程碑掌握闸) | v2(项目工作室) | 对弱基础学生不给支架 = 把人推进深水池;项目制空转、用项目逃避数学 |
| 拼图教学法 | 弱/矛盾:旧元分析 g=0.77,但 Stanczak 2022 五项 RCT 全部 ES=0.00 | 中(须改造,不建议作核心路径) | v2,且只作费曼/互教的变体 | 单人场景丢失“社会互依”动机;强行拆数学知识拓扑很危险;AI 扮同学易角色混乱 |
| 联通主义 | 几乎无实证:无 RCT、无可靠效应量、缺可操作教学设计 | 低 | 仅作设计理念,不立为教学法 | 预设高信息素养,初高中生缺“存量节点”无从建连;连接必须可追踪可审核,否则是空话 |
AI 评价与游戏化的硬约束(决定项目工作室能不能做、怎么做):
- AI 评价语言类 + 有 rubric 的任务已达中等可靠:o1 作文评分与人类 r=.74、ICC=.80(arXiv 2411.16337),可用于低风险形成性反馈——但所有模型都有“打高分”通胀偏向。
- AI 评价综合创意项目目前不可靠:专项基准 PBLBench 显示最优模型排名准确率仅 59%,对不完整报告仍持续给高分(arXiv 2505.17050)。结论:AI 只做形成性建议 + rubric 初评,绝不独立做终结性评分——这与护栏“AI 不替代最终判定”完全一致(呼应 §9)。
- 游戏化必须分清两类:成就型/能力确认徽章安全且小幅正向(Frontiers 2024, g=0.257);而打卡型/完成型奖励 + 绝对排行榜会侵蚀内在动机(Deci 1999, d≈-0.40),对弱基础学生伤害最大——应在架构层排除(与 learning-principles §8.1 一致)。
16. 分阶段引入建议
把上表翻译成路线图,核心是克制:不是七个一起上,而是按“证据强度 × 落地成本 × 对 v1 闭环的增益”排序。
- 底座(v1 已含,不是新功能):费曼出口(FR-6)、组块化自适应与掌握判定(FR-1/FR-2)、Canon 知识图谱可视化(FR-1 + 家长仪表盘学习地图)。先把这条主线闭环跑通、拿到双主指标,再谈扩展。
- 近期可低成本叠加(v1.x,与中国刚需强对齐): 1. 个人概念图——“AI 给骨架 + 学生补 1–3 条边 + 苏格拉底验边 + 验过才更新掌握权重”; 2. 跨学科“延伸关联卡片”——掌握某知识点后可选触发,每条连接显式标注“对应中/高考情境化题型”,消除家长偏科焦虑。
- 中后期(v2,重投入 + 高风险,需前置条件):项目工作室 + 互教工坊 + AI 作品评价器 + 人工审核台。前置条件:① 有足够真实用户量支撑真人配对(否则互教只能靠 AI 假同伴,信任打折);② 志愿者审核产能可持续;③ AI 综合评价可靠性提升到可用。
- 仅作设计理念、不单独立项:联通主义——它的价值是提供“学习 = 一张可审核的知识/人/资源/作品连接网络”这一架构隐喻,指导前面三张图谱的设计即可,不要把它当成一种要交给学生用的“学习法”。
17. 新增待决问题(排序与边界)
§14 已列了 7 个偏“机制细节”的问题;这里补 6 个偏“排序与边界”、更上层的问题:
- 排序与克制:除已在 v1 的费曼/组块/知识图谱外,其余方向在“跑通闭环、拿到双主指标”之前是否一律不碰?引入新方向是否就用 learning-principles §9 的七问做闸门?
- AI 模拟同伴 vs 真人:拼图/互教在没有真实用户量时,是用 AI 扮同伴,还是直接延后到能做真人配对?(研究提示教师/同伴的“社会临场感”对学习与信任很关键,AI 假同伴用不好会降低信任)需要一个“何时切到真人”的明确触发条件。
- 应试 vs 素养张力:跨学科、项目化是素养路线,但目标用户的刚需往往是中高考提分。家长会不会觉得“不务正业”?如何把跨学科/项目显性挂钩“情境化命题”(这已是中考趋势),让它既练素养又服务刚需?
- 认知负荷预算:一个 10–12 分钟短闭环已含“尝试 → 错因 → 提示 → 再试 → 独立复做 → 费曼 → 延迟复测”。再叠加补边、跨学科、项目,每天“认知预算”如何分配?哪些每日必做、哪些走周节奏或可选?
- 内在动机红线:项目上传 + AI 评价 + 徽章,如何保证只奖励“高质量行为”(独立尝试、修错、讲清、迁移),而不退化成“完成打卡得分 / 绝对排行榜”这类已被证实侵蚀内在动机的设计?
- AI 评价的护栏一致性:护栏原则是“AI 不给答案”;那“AI 评价/打分作品”在精神上是否一致?当 AI 综合评价不可靠(约 59%)时由谁兜底?公益项目的人工抽检产能从哪里来、如何排队?
18. 来源
完整调研见
../research/下三份报告(四种学习法 / 知识图谱与跨学科 / 项目化与 AI 评价)。关键来源:
- 费曼/自我解释:Bisra et al. 2018 元分析 — https://gwern.net/doc/psychology/spaced-repetition/2018-bisra.pdf
- Protégé 效应:Chase et al. 2009(Stanford)— https://aaalab.stanford.edu/assets/papers/2009/Protege_Effect_Teachable_Agents.pdf
- 刻意练习边界:Macnamara et al. 2014 — https://www.psychologie.uzh.ch/dam/jcr:658d39fe-2f4b-467f-9ae2-ffeb25caf2b6/McNamara.PsychSci.25.2014.pdf
- 概念图主动构建:Adesope et al. 2017 — https://link.springer.com/article/10.1007/s10648-017-9403-9
- map shock / 认知负荷:Frontiers in Education 2022 — https://www.frontiersin.org/journals/education/articles/10.3389/feduc.2022.892312/full
- STEM 跨学科整合:Zhou et al. 2025 — https://link.springer.com/article/10.1007/s11165-024-10216-y
- 中考情境化命题趋势(2024 广州)— https://wap.ycwb.com/2024-07/03/content_52784132.htm
- 跨学科“浅层关联”批评 — https://indianexpress.com/article/opinion/columns/true-interdisciplinary-education-must-have-depth-before-breadth-10365296/
- 拼图教学法 RCT 零效果:Stanczak 2022(ERIC)— https://eric.ed.gov/?id=EJ1372764
- 联通主义可行性质疑 — https://cdspress.ca/wp-content/uploads/2023/07/CALL-Connectivism_Langridge.pdf
- PBL 效应量(Visible Learning MetaX)— https://www.visiblelearningmetax.com/influences/view/project-based_learning
- 新手需支架(Kirschner 2006 / scaffolded PBL)— https://link.springer.com/article/10.1007/s10648-023-09828-z
- LLM 作文评分一致性:arXiv 2411.16337 — https://arxiv.org/html/2411.16337
- AI 评 PBL 项目不可靠:PBLBench,arXiv 2505.17050 — https://arxiv.org/html/2505.17050
- 外在奖励侵蚀内在动机:Deci, Koestner & Ryan 1999 — https://pubmed.ncbi.nlm.nih.gov/10589297/
- 成就型徽章正向:Frontiers in Education 2024 — https://www.frontiersin.org/journals/education/articles/10.3389/feduc.2024.1429452/full
- 排行榜对低成绩学生负效应 — https://link.springer.com/article/10.1007/s11423-023-10337-7
- 产品参考:Sora Schools “Goodbye Grades” — https://trends.soraschools.com/goodbye-grades ;Feynman AI — https://feynmanai.net/