调研报告:学生为何不学——动机、留存、辍学的学习科学
日期: 2026-06-15 任务: 系统梳理"为什么自学/在线学习平台留不住学生、学生不主动学"的学习科学与实证证据,为"AI 版可汗学院"提供战略级风险参照与干预依据。 适用子领域(C): 动机科学、MOOC留存、自我调节学习、游戏化双刃剑、新颖性效应
调研摘要
在线自学平台的留存危机是有充分实证基础的结构性问题,而非个别产品的失误。MOOC 完成率长期徘徊在 3-15%(中位数 12.6%)、六年未改善;最需要帮助的低自律学生从在线学习获益最少(马太效应);初高中生自我调节能力尚未成熟,无督促环境下的自学尤为困难。但学习科学同样揭示了明确可行的干预手段:归属感干预、苏格拉底式护栏 AI 辅导、脚手架支持和社交临场感设计,均有随机对照实验(RCT)级别的证据支持。
第一部分:MOOC 与在线自学的辍学/低完成率
1.1 数据全景
| 来源 | 结论 | 证据强度 |
|---|---|---|
| Jordan (2015) 221个MOOC汇总数据集 | 完成率中位数 12.6%,范围 0.7%–52.1% | 已验证事实 |
| Deshpande & Chukhlomin 2017;Jordan 2014;Liyanagunawardena 2013 | MOOC 留存率普遍在 3%–15% 区间 | 已验证事实(多重来源) |
| Eriksson et al. 2017;Narayanasamy & Elçi 2020 | 超过 90% 的注册者从未完成课程 | 已验证事实 |
| Reich & Ruipérez-Valiente (2019, Science) | 分析 2012-2018 年 edX 全部课程:完成率六年无改善;52% 注册者从未开始学习;增长几乎全部来自富裕国家 | 已验证事实(大规模纵向数据) |
| Coursera Coursera 早期数据 | Coursera 平均完成率约 6.1% | 已验证事实 |
关键数据点:52% 注册者注册后从未开始学习(Reich & Ruipérez-Valiente 2019)。这意味着问题甚至在"坚持"之前就出现在"启动"阶段。
1.2 MOOC 元年炒作与幻灭
2012 年《纽约时报》称为"MOOC 元年",Coursera(2012年1月)、edX(2012年5月)、Udacity 同年相继推出。斯坦福校长 John Hennessy 警告"海啸",Sebastian Thrun 预测"仅 10 所大学能存活"。但 2013 年起幻灭: - Udacity(2013):Sebastian Thrun 公开承认原模式失败,转向职场技能"纳米学位"。 - Coursera(2016):明确转向企业/B2B 模式,建起付费墙,创始人 Daphne Koller 离开。 - edX(2018):最后一家宣布转向在线硕士学位项目,此后被 2U 收购。
Reich & Ruipérez-Valiente (2019) 在 Science 上指出:MOOC 的增长从未兑现"民主化教育"的承诺,反而集中于最富裕国家的最优特权学习者。
来源:The MOOC pivot - Science 2019;What Happened to the MOOC? - Zocalo Public Square 2022
1.3 辍学归因研究
Dalipi et al. (2018) 系统综述发现辍学两大类因素: 1. 学习者因素:缺乏动机、时间不足、背景知识不足。 2. 平台/课程因素:课程设计模糊、缺乏互动、孤独感、隐性成本。
斯坦福 CEPA Working Paper(2015,分析 2.1 百万学生、44门课程):参与度在第一周急剧下降,之后趋于平稳——第一、二周是留住学生的决定性窗口。
来源:PMC - Take a MOOC and then drop;CEPA Stanford Working Paper
第二部分:自我调节学习(SRL)与马太效应
2.1 SRL 的核心问题
自我调节学习(Self-Regulated Learning, SRL)是在线自学的基础能力,包括:目标设定、时间规划、元认知监控、策略调整。在线学习相比面授课堂,对 SRL 的依赖更高,因为: - 没有外部时间结构(下课铃/课表) - 没有教师实时督促 - 没有同伴即时问责
关键实证(Sanna Oinas 2025,混合方法研究,N=29,863): - SRL 最高的学生(31%):在网课中开发了新的学习策略、元认知能力; - SRL 最低的学生(21%):一半声称"什么都没学到",且往往缺乏家长支持。
结论:即使设备获取机会均等,学习体验也高度分化——分化主要由 SRL 能力决定而非设备。
来源:Sanna Oinas 2025, isidore.science
2.2 马太效应(Matthew Effect)
Saleh & Sanders(RISE Journal)明确论证:在线教育中,"拥有者"(高 SRL、高 SES、已有优质教育背景)从在线学习中获益更多,"匮乏者"则更少获益,不平等反被放大。
2025 年澳大利亚 ITS 平台研究(66,451 名高中生,结构方程建模): - 富裕和城市学校的学生更早使用 ITS、使用更多年、学习效果更好; - ITS 使用对学业成果的影响被社会经济背景放大——贫困农村学生使用 ITS 反而扩大了与优势群体的差距。
结论(已验证):如果没有针对性的人工干预,技术工具往往充当不平等的放大器而非均衡器。这对"面向教育资源缺乏孩子"的 AI 版可汗学院具有直接警示意义。
来源:ITS Matthew Effect - eprints.soton.ac.uk 2025;Matthew Effect in Online Education - Saleh & Sanders
2.3 青少年 SRL 发展不成熟
多项发展心理学研究证明初高中阶段 SRL 的特殊性:
- 动机下滑:从小学到中学,动机(任务价值感、目标导向)显著下降(Effeney et al. 2013;Springer 2023 研究,N覆盖希腊多个年级)。
- 元认知延迟发展:元认知意识的真正发展从初中阶段才开始,在此之前学生没有监控自己学习的能力基础。
- 执行功能(EF)未成熟:延迟满足、决策等高阶 EF 要到 15 岁左右才基本成熟(Prencipe et al. 2011;Crone & van der Molen 2004)。
实际含义:要求 12-16 岁的孩子在无人督促的环境下自主持续学习,从神经发育角度看就是强人所难。
来源:Springer Current Psychology 2023 - SRL and EF adolescents;PMC - Metacognitive self-regulation age differences
第三部分:动机科学——自我决定理论(SDT)
3.1 SDT 三需要模型
Ryan & Deci 的自我决定理论(SDT)是在线学习动机研究中引用最广泛的理论框架(Springer Nature 2022 系统综述确认)。三个核心心理需要:
| 需要 | 含义 | 在线学习中的破坏因素 |
|---|---|---|
| 自主(Autonomy) | 感到自己是学习的主动选择者 | 被迫学习、无选择权 |
| 胜任(Competence) | 感到自己有能力完成任务 | 内容太难/太易、无及时反馈 |
| 归属(Relatedness) | 感到与他人连结 | 孤独、无社交、无人在意自己 |
关键元分析(Wang et al. 2024,36项SDT干预研究,N=11,792): - 自主支持干预效果量 g=1.14(实验/准实验设计); - 胜任感干预效果量 g=0.48; - 内在动机提升效果量 g=0.58; - 归属感干预效果不显著(g=0.44,p>0.05)——这一点是反证,暗示归属感难以通过简单干预提升。
来源:SDT Meta-Analysis 2024 - selfdeterminationtheory.org
3.2 "一个人学"为什么失败
社交临场感(Social Presence)的缺失是在线学习低留存的核心机制之一:
-
社交临场感与满意度相关 r=0.56、与感知学习相关 r=0.51(meta分析,k=26项研究)——来源:Computers in Human Behavior 2017
-
孤独感 → 学习倦怠(burnout),且社交临场感不能缓冲孤独感导致的倦怠(N=618,中国大学生,PMC 2025)。
-
学生在面授课中与教师的人际关系显著强于网课;感受到孤独的学生更可能退课(多项研究综述)。
RCT 级别证据:社交互动的因果效应 - 一项 30,317 名学生(183国)参与的 MOOC 三项随机实验(SSRN): - 被鼓励访问讨论版的学生,下周完成测验的概率提升 4.3%; - 完成一对一同步讨论的学生,次周测验完成率和分数提升 10%。
人类问责(accountability)的因果效应(RCT): - 德国大学 RCT(COVID 期间,online):同伴导师(每周 1 对 1 讨论自我管理技能)显著提升动机、学习行为、考试报名率,对优等生效果尤为强烈。来源:Erlangen RCT - laser.uni-erlangen.de
注意:一项 MOOC 问责实验(J-线 OLJ)发现课外问责(accountability-outside)对美国学习者的评论数提升有效,但整体完成率无显著提升——说明问责干预效果具有情境依赖性(条件成立才有效)。
来源:Does Social Interaction Improve Learning Outcomes - SSRN
第四部分:游戏化的双刃剑
4.1 过度理由效应(Overjustification Effect)
Lepper et al. (1973) 最早提出:对原本内在驱动的行为施加外在奖励,会把内在动机替换为外在动机。外在奖励撤除后,动机不复存在。
Duolingo 的教训: - 连续打卡(streak)机制:长期用户的核心动机从"学语言"漂移到"不断条"——这是 SDT 所说的"控制性动机"取代"自主性动机"。 - 用户反馈研究(Hkust 2022,Duolingo 论坛内容分析 + 15 人访谈):游戏化误用的三大原因——竞争性、过度沉迷于娱乐性、从众(herding)。 - "最短可行课程"问题:连续打卡激励下,理性策略是每天完成最短最容易的课——维持打卡但无学习价值。 - 研究发现:以维持 streak 为主要动机的用户,六个月后学习留存显著低于以真实语言兴趣为驱动的用户(控制总使用时间后该差异依然显著)。
来源:When Gamification Spoils Your Learning - arxiv 2203.16175;Datafield.dev Case Study Duolingo
4.2 游戏化何时有效(正向反证)
- 积极反馈(表扬、提示进步)可显著提升内在动机(Deci 1971,被 SDT 体系引用);
- 自主感和胜任感维度的游戏化(而非控制和竞争)与留存正相关;
- Tsay et al. & Bishtref 2019 纵向研究(333名学生,3年):第二年游戏化学生参与度高于第一年,说明克服新颖性衰减是可能的——关键在于让互动有意义而非维持指标。
- EFL 研究(Duolingo 用户,2026,印尼):当学习者感知到"享受和有意义"时,游戏化确实促进了内在动机的内化——条件是设计导向自主而非控制。
结论:表扬/进度反馈有效;竞争性排行榜、连续打卡等控制性机制长期有害。重点是"游戏化什么"和"如何退出"。
来源:Springer gamification novelty effect longitudinal 2022
第五部分:新颖性效应(Novelty Effect)
5.1 EdTech 的"蜜月期"
几乎所有教育技术创新都伴随新颖性效应: - 引入后 2-4 周内,参与度和热情显著高于基准; - 随后开始衰减,通常在 4-10 周内效果减半甚至归零(Springer Nature gamification 14周研究,2022);
这直接导致 RCT 结果被污染:如果研究期短于 3-4 个月,正效应可能只是新鲜感,而非真实学习效果。
5.2 对 AI 学习产品的含义(推测)
推测(尚无直接 RCT 证据): - AI 原生教育产品(包括生成式 AI 辅导)极可能出现同样的新颖性效应。 - 建议:AI 版可汗学院早期 DAU/留存数据需谨慎解读,至少跟踪 3 个月以上才能区分新颖性与真实留存。
来源:Springer novelty effect gamification 2022;Frontiers Education gamification novelty 2023
第六部分:AI 不加护栏会直接伤害学习(Bastani et al. 2024/2025 PNAS)
这是对本项目最直接的已验证实证:
实验设计:约 1000 名高中生数学课,随机分配到三组: 1. 控制组(无 AI) 2. GPT Base(类 ChatGPT 界面,无限制) 3. GPT Tutor(加了"给提示而非直接答案"护栏)
结果: - 练习时表现:GPT Base +48%,GPT Tutor +127%(vs 控制组)——AI 确实大幅提升即时表现。 - 考试时(无 AI 辅助):GPT Base 比控制组 低 17%;GPT Tutor 与控制组无显著差异。 - 学生行为分析:GPT Base 学生直接索取并抄写答案;GPT Tutor 学生更多独立尝试然后要求帮助。 - 学生自我认知盲区:GPT Base 学生不认为自己学习受损——他们不知道自己在走捷径。
结论(已验证):"护栏式解题流"(AI 不直接给答案、给提示、引导思考)是必须的设计约束,不是可选的特性。
来源:Bastani et al. PNAS 2025;SSRN 2024 Working Paper*
第七部分:行为科学干预在规模化时的效果衰减
Reich et al. (2020, PNAS) 在 247 门 Harvard/MIT/Stanford 课程、25万名学生上测试多种行为科学干预(自我调节提醒、价值相关性信息等): - 自我调节干预:提升了前几周参与度,但不影响最终完成率。 - 价值相关性干预:仅在存在"全球差距"的课程中、面向发展中国家学生时有效;一旦情境不匹配,效果消失。 - 核心结论:在多样化情境中规模化时,平均效果比单一研究小 10 倍(数量级差距)。
来源:Scaling behavioral science interventions - PNAS 2020
综合分析:根因清单与有效干预清单
A. 学生不学的根因清单
| # | 根因 | 机制 | 证据强度 |
|---|---|---|---|
| R1 | 低自我调节能力(SRL) | 缺乏目标设定、时间管理、元认知监控,在无结构环境中迅速放弃 | 强(多项 RCT 和大样本研究) |
| R2 | 动机三需要未满足(SDT) | 感知不到自主感(被迫学)、胜任感(太难/太易)、归属感(孤独)→ 动机外化或消失 | 强(SDT 体系有大量 RCT) |
| R3 | 社交孤立与无问责 | 一个人学没有问责闭环,孤独触发倦怠,无教师关注 → 退出 | 强(多项 RCT) |
| R4 | 青少年认知/元认知尚未成熟 | 12-16 岁延迟满足、目标坚持等执行功能尚在发育,无外部结构容易放弃 | 强(发展心理学实证) |
| R5 | 马太效应——弱势学生获益最少 | 高 SRL 学习者越学越强,低 SRL/弱势学习者越学越迷失 | 强(大样本纵向+准实验) |
| R6 | 启动失败(52%注册者从未开始) | 注册与学习之间的冷启动门槛极高,意向与行动存在巨大"意图-行为鸿沟" | 强(edX 6年数据) |
| R7 | 游戏化走向反噬 | 连续打卡等控制性机制侵蚀内在动机,学生为打卡而学,内在兴趣消亡 | 中-强(SDT 实验+用户行为分析) |
| R8 | 新颖性效应掩盖真实留存 | 初期高参与度来自新鲜感,4-10 周后迅速衰减,产品误判真实效果 | 中(纵向设计研究) |
| R9 | AI 直接给答案制造学习幻觉 | 学生即时表现好,但真实学习受损(-17%),且学生无自我察觉 | 强(PNAS RCT,~1000 人) |
| R10 | 行为干预规模化效果衰减 10 倍 | 单一情境有效的干预在多元情境下效果骤降 | 中-强(25万学生跨 247 门课) |
B. 已被证明能提升坚持度的有效干预清单
| # | 干预手段 | 效果 | 证据强度 | 最佳设计原则 |
|---|---|---|---|---|
| I1 | 脚手架支持(Scaffolding) | 在线学习表现总体效果量 ES=0.53(meta分析,32项研究) | 强 | 提供引导结构,逐步撤退 |
| I2 | SRL 干预(目标设定、自我监控、策略反馈) | 学业成绩效果量 ES=0.69(meta分析,在线+混合场景) | 强 | 明确学习目标和进度可视化 |
| I3 | 归属感/社交连结干预 | RCT:弱势学生两年持续就读率显著提升(Science Advances,N=1063) | 强 | 定制化、具体化地传递"你属于这里" |
| I4 | 社交互动设计(讨论板、一对一交流) | 一对一讨论后次周完成率+10%(N=30,317,3项随机实验) | 强 | 同伴互动质量高于数量 |
| I5 | 护栏式 AI 辅导(提示而非答案) | 练习+127%、考试与控制组无显著差异(GPT Tutor vs GPT Base -17%) | 强(PNAS RCT) | 禁止直接给答案,必须给提示 |
| I6 | 教师临场感(个性化消息/存在感) | 满意度和感知学习显著提升,建立师生联结 | 中(部分研究存在感知vs真实差异) | 个人化、定期、真实 |
| I7 | 成长型思维与自我效能干预 | 对弱势学生 GPA 提升有帮助(密歇根州立 RCT);但规模化效果衰减 | 中(情境依赖) | 需配合具体学科内容 |
| I8 | 同伴导师(Peer Mentoring) | RCT:提升动机、学习行为、考试报名;优等生效果最强 | 中-强(德国大学 RCT) | 聚焦自我管理而非知识本身 |
| I9 | 价值相关性干预(告知知识的现实意义) | 在"存在全球学习差距"的课程中,对发展中国家学生完成率有效 | 中(情境依赖) | 必须真实相关,不能泛泛 |
| I10 | 积极反馈/进度可视化(非竞争性) | 增强胜任感,维持内在动机,避免过度理由效应 | 中-强 | 反馈聚焦进步而非排名 |
正向反证:哪些设计确实留住了学生?
综合有效设计特征(跨多项 RCT):
-
"高科技 + 高温情"(High Tech, High Touch):Project COMPASS RCT 证明,在线课程加入教学临场感、社交临场感、认知临场感的综合重设计,少数族裔学生通过率显著提升,且提高了下一年留存。来源:Sci-Direct High Tech High Touch RCT
-
第一、二周是关键:参与度下滑主要在第一周,第一二周留住学生后曲线趋于平稳(斯坦福 CEPA)。→ 冷启动设计极为关键。
-
早期结构化承诺:事先填写"何时学习"的学生持续率显著更高(J-PAL 研究)。
-
归属感来自具体而真实的联结:抽象的"欢迎语"无效;个人化消息、连接课程内容与学生生活经历的周度沟通有效(Sara Avila Forcada 实验,AEA P&P 2023,改善成绩和评价)。
-
掌握式学习(Mastery Learning)的胜任感效应:当学生感到"我真的会了",内在动机得到强化,这是与打卡留存(空洞留存)根本不同的良性循环。
对"AI 版可汗学院"的具体风险与设计启示
核心风险点
-
目标群体(低自律/弱势初高中生)是最脆弱群体:SRL 最弱、最需要帮助的孩子,恰恰是从自学平台获益最少的人(马太效应)——这是本项目必须系统性破解的结构矛盾。
-
冷启动问题:52% 注册者从未开始。产品第一周的设计如同急诊室:必须极快建立连结和胜任感。
-
游戏化陷阱:若以"连续打卡/积分/排行榜"作为主要留存手段,3-6 个月后将面临内在动机被消费殆尽的问题(Duolingo 案例)。
-
AI 直接答题风险:如不做护栏,学生会把 AI 当抄答案机器,练习表现好但真实学力受损(Bastani PNAS)。
-
新颖性效应掩盖真实留存:前 4-8 周数据可能虚高,需要至少 3 个月跟踪才能看到真实留存曲线。
-
规模化干预效果衰减:有效的个性化干预在规模化时平均效果降为 1/10(Reich et al. PNAS 2020),需持续 A/B 测试和分人群迭代。
设计建议(基于实证)
- 护栏式解题流是非可选项:苏格拉底式追问 → 提示 → 步骤分解,禁止直答。这既是学习科学要求,也有 PNAS 级别 RCT 支撑。
- 第一周留存设计:快速建立胜任感(调适内容难度至成功体验)+ 人工问候/教师 touch(哪怕是半自动化)。
- 社交化问责闭环:引入同伴学习小组或家长可见进度报告,提供外部问责锚点(尤其对低 SRL 学生)。
- SRL 脚手架内嵌:目标设定向导、每周学习计划、反思提示——不能假设学生有 SRL,必须在产品里教。
- 反竞争游戏化:避免排行榜、避免破损 streak 惩罚感,改用进步可视化(展示"我比自己上周好了多少")。
- 归属感设计:具体、真实、定期的个人化连结(展示"像你一样的同学也在学"),比通用"欢迎"语有效。
不确定项与推测说明
| 项目 | 状态 | 说明 |
|---|---|---|
| AI 原生教育产品的新颖性效应持续时长 | 推测 | 尚无专门 RCT 数据,推测与其他EdTech类似,需产品自行追踪 |
| 中国初高中特定人群的 SRL 基线数据 | 数据有限 | 中文文献多为疫情期间数据,代表性有待确认 |
| "掌握式学习 + AI"组合对留存的长期效果 | 尚无高质量 RCT | Khanmigo 等产品早期数据乐观但样本小、周期短 |
| 同伴导师(Peer Mentoring)对初高中生(vs大学生)的效果迁移 | 推测 | 目前 RCT 主要在大学生群体,初高中迁移有待验证 |
| 行为干预在中国教育文化情境下的效果差异 | 未知 | 西方研究为主,文化适配尚需在地化 RCT |
参考来源
-
Jordan (2015). MOOC completion rates data visualization — 支撑 MOOC 完成率 ~15% 结论
-
Jordan (2014/2015). MOOC Completion Rates Revisited - ERIC EJ1067937 — 支撑中位数 12.6%、0.7%-52.1% 区间
-
Reich & Ruipérez-Valiente (2019). The MOOC Pivot. Science 363(6423) — 支撑"52%注册者从未开始"、"完成率六年无改善"、"富裕国家集中"等核心结论
-
Springer Nature (2022). Role of motivation in MOOCs' retention rates: systematic review — 支撑 SDT 是最广泛使用的 MOOC 动机理论框架
-
Wang et al. (2024). SDT-based interventions meta-analysis. selfdeterminationtheory.org — 支撑 SDT 干预效果量数据
-
PMC (2022). Take a MOOC and then drop: systematic review — 支撑辍学归因两大类因素
-
CEPA Stanford Working Paper No.15-09 (2015) — 支撑第一二周是关键留存窗口
-
Bastani et al. (2024/2025 PNAS). Generative AI Can Harm Learning — 支撑 AI 无护栏 -17%、护栏消除伤害的核心结论
-
Saleh & Sanders. The Wolf in Sheep's Clothing: Matthew Effect in Online Education — 支撑在线教育马太效应论证
-
ITS AdaptiveMath Australia 2025 (eprints.soton.ac.uk) — 支撑 ITS 平台可能放大不平等的大样本实证
-
Sanna Oinas (2025). Self-Regulation of E-learning: Mixed Method Study — 支撑 SRL 最低组 50% "什么都没学到"结论,N=29,863
-
Arxiv 2203.16175 (2022). When Gamification Spoils Your Learning — 支撑游戏化误用与过度理由效应
-
Springer gamification novelty effect longitudinal 14-week study (2022) — 支撑新颖性效应 4-10 周内衰减
-
Social Presence meta-analysis - Computers in Human Behavior (2017) — 支撑社交临场感与满意度和学习的相关性
-
SSRN - Social Interaction MOOC RCT (30,317 students) — 支撑一对一讨论提升完成率 10%
-
Reich et al. (2020, PNAS). Scaling behavioral science interventions — 支撑规模化后效果衰减 10 倍
-
Springer Current Psychology (2023). SRL, metacognition, EF transitions — 支撑初高中阶段 SRL 和 EF 发展不成熟
-
Science Advances (2020). Belonging intervention improves retention — 支撑归属感干预提升两年持续就读率
-
High Tech High Touch RCT (2020, SciDirect) — 支撑综合临场感重设计 RCT
-
Scaffolding meta-analysis MDPI (2023, 32项研究 ES=0.53) — 支撑脚手架对在线学习的效果
-
SRL interventions meta-analysis online/blended K-12 & HE (ResearchGate, ES=0.69) — 支撑 SRL 干预效果量
-
Erlangen peer mentoring RCT (laser.uni-erlangen.de) — 支撑同伴导师提升动机与学习行为