调研报告：学生为何不学——动机、留存、辍学的学习科学

日期: 2026-06-15 任务: 系统梳理"为什么自学/在线学习平台留不住学生、学生不主动学"的学习科学与实证证据，为"AI 版可汗学院"提供战略级风险参照与干预依据。 适用子领域（C）: 动机科学、MOOC留存、自我调节学习、游戏化双刃剑、新颖性效应

调研摘要

在线自学平台的留存危机是有充分实证基础的结构性问题，而非个别产品的失误。MOOC 完成率长期徘徊在 3-15%（中位数 12.6%）、六年未改善；最需要帮助的低自律学生从在线学习获益最少（马太效应）；初高中生自我调节能力尚未成熟，无督促环境下的自学尤为困难。但学习科学同样揭示了明确可行的干预手段：归属感干预、苏格拉底式护栏 AI 辅导、脚手架支持和社交临场感设计，均有随机对照实验（RCT）级别的证据支持。

第一部分：MOOC 与在线自学的辍学/低完成率

1.1 数据全景

来源	结论	证据强度
Jordan (2015) 221个MOOC汇总数据集	完成率中位数 12.6%，范围 0.7%–52.1%	已验证事实
Deshpande & Chukhlomin 2017；Jordan 2014；Liyanagunawardena 2013	MOOC 留存率普遍在 3%–15% 区间	已验证事实（多重来源）
Eriksson et al. 2017；Narayanasamy & Elçi 2020	超过 90% 的注册者从未完成课程	已验证事实
Reich & Ruipérez-Valiente (2019, Science)	分析 2012-2018 年 edX 全部课程：完成率六年无改善；52% 注册者从未开始学习；增长几乎全部来自富裕国家	已验证事实（大规模纵向数据）
Coursera Coursera 早期数据	Coursera 平均完成率约 6.1%	已验证事实

关键数据点：52% 注册者注册后从未开始学习（Reich & Ruipérez-Valiente 2019）。这意味着问题甚至在"坚持"之前就出现在"启动"阶段。

1.2 MOOC 元年炒作与幻灭

2012 年《纽约时报》称为"MOOC 元年"，Coursera（2012年1月）、edX（2012年5月）、Udacity 同年相继推出。斯坦福校长 John Hennessy 警告"海啸"，Sebastian Thrun 预测"仅 10 所大学能存活"。但 2013 年起幻灭： - Udacity（2013）：Sebastian Thrun 公开承认原模式失败，转向职场技能"纳米学位"。 - Coursera（2016）：明确转向企业/B2B 模式，建起付费墙，创始人 Daphne Koller 离开。 - edX（2018）：最后一家宣布转向在线硕士学位项目，此后被 2U 收购。

Reich & Ruipérez-Valiente (2019) 在 Science 上指出：MOOC 的增长从未兑现"民主化教育"的承诺，反而集中于最富裕国家的最优特权学习者。

来源：The MOOC pivot - Science 2019；What Happened to the MOOC? - Zocalo Public Square 2022

1.3 辍学归因研究

Dalipi et al. (2018) 系统综述发现辍学两大类因素： 1. 学习者因素：缺乏动机、时间不足、背景知识不足。 2. 平台/课程因素：课程设计模糊、缺乏互动、孤独感、隐性成本。

斯坦福 CEPA Working Paper（2015，分析 2.1 百万学生、44门课程）：参与度在第一周急剧下降，之后趋于平稳——第一、二周是留住学生的决定性窗口。

来源：PMC - Take a MOOC and then drop；CEPA Stanford Working Paper

第二部分：自我调节学习（SRL）与马太效应

2.1 SRL 的核心问题

自我调节学习（Self-Regulated Learning, SRL）是在线自学的基础能力，包括：目标设定、时间规划、元认知监控、策略调整。在线学习相比面授课堂，对 SRL 的依赖更高，因为： - 没有外部时间结构（下课铃/课表） - 没有教师实时督促 - 没有同伴即时问责

关键实证（Sanna Oinas 2025，混合方法研究，N=29,863）： - SRL 最高的学生（31%）：在网课中开发了新的学习策略、元认知能力； - SRL 最低的学生（21%）：一半声称"什么都没学到"，且往往缺乏家长支持。

结论：即使设备获取机会均等，学习体验也高度分化——分化主要由 SRL 能力决定而非设备。

来源：Sanna Oinas 2025, isidore.science

2.2 马太效应（Matthew Effect）

Saleh & Sanders（RISE Journal）明确论证：在线教育中，"拥有者"（高 SRL、高 SES、已有优质教育背景）从在线学习中获益更多，"匮乏者"则更少获益，不平等反被放大。

2025 年澳大利亚 ITS 平台研究（66,451 名高中生，结构方程建模）： - 富裕和城市学校的学生更早使用 ITS、使用更多年、学习效果更好； - ITS 使用对学业成果的影响被社会经济背景放大——贫困农村学生使用 ITS 反而扩大了与优势群体的差距。

结论（已验证）：如果没有针对性的人工干预，技术工具往往充当不平等的放大器而非均衡器。这对"面向教育资源缺乏孩子"的 AI 版可汗学院具有直接警示意义。

来源：ITS Matthew Effect - eprints.soton.ac.uk 2025；Matthew Effect in Online Education - Saleh & Sanders

2.3 青少年 SRL 发展不成熟

多项发展心理学研究证明初高中阶段 SRL 的特殊性：

动机下滑：从小学到中学，动机（任务价值感、目标导向）显著下降（Effeney et al. 2013；Springer 2023 研究，N覆盖希腊多个年级）。
元认知延迟发展：元认知意识的真正发展从初中阶段才开始，在此之前学生没有监控自己学习的能力基础。
执行功能（EF）未成熟：延迟满足、决策等高阶 EF 要到 15 岁左右才基本成熟（Prencipe et al. 2011；Crone & van der Molen 2004）。

实际含义：要求 12-16 岁的孩子在无人督促的环境下自主持续学习，从神经发育角度看就是强人所难。

来源：Springer Current Psychology 2023 - SRL and EF adolescents；PMC - Metacognitive self-regulation age differences

第三部分：动机科学——自我决定理论（SDT）

3.1 SDT 三需要模型

Ryan & Deci 的自我决定理论（SDT）是在线学习动机研究中引用最广泛的理论框架（Springer Nature 2022 系统综述确认）。三个核心心理需要：

需要	含义	在线学习中的破坏因素
自主（Autonomy）	感到自己是学习的主动选择者	被迫学习、无选择权
胜任（Competence）	感到自己有能力完成任务	内容太难/太易、无及时反馈
归属（Relatedness）	感到与他人连结	孤独、无社交、无人在意自己

关键元分析（Wang et al. 2024，36项SDT干预研究，N=11,792）： - 自主支持干预效果量 g=1.14（实验/准实验设计）； - 胜任感干预效果量 g=0.48； - 内在动机提升效果量 g=0.58； - 归属感干预效果不显著（g=0.44，p>0.05）——这一点是反证，暗示归属感难以通过简单干预提升。

来源：SDT Meta-Analysis 2024 - selfdeterminationtheory.org

3.2 "一个人学"为什么失败

社交临场感（Social Presence）的缺失是在线学习低留存的核心机制之一：

社交临场感与满意度相关 r=0.56、与感知学习相关 r=0.51（meta分析，k=26项研究）——来源：Computers in Human Behavior 2017
孤独感 → 学习倦怠（burnout），且社交临场感不能缓冲孤独感导致的倦怠（N=618，中国大学生，PMC 2025）。
学生在面授课中与教师的人际关系显著强于网课；感受到孤独的学生更可能退课（多项研究综述）。

RCT 级别证据：社交互动的因果效应 - 一项 30,317 名学生（183国）参与的 MOOC 三项随机实验（SSRN）： - 被鼓励访问讨论版的学生，下周完成测验的概率提升 4.3%； - 完成一对一同步讨论的学生，次周测验完成率和分数提升 10%。

人类问责（accountability）的因果效应（RCT）： - 德国大学 RCT（COVID 期间，online）：同伴导师（每周 1 对 1 讨论自我管理技能）显著提升动机、学习行为、考试报名率，对优等生效果尤为强烈。来源：Erlangen RCT - laser.uni-erlangen.de

注意：一项 MOOC 问责实验（J-线 OLJ）发现课外问责（accountability-outside）对美国学习者的评论数提升有效，但整体完成率无显著提升——说明问责干预效果具有情境依赖性（条件成立才有效）。

来源：Does Social Interaction Improve Learning Outcomes - SSRN

第四部分：游戏化的双刃剑

4.1 过度理由效应（Overjustification Effect）

Lepper et al. (1973) 最早提出：对原本内在驱动的行为施加外在奖励，会把内在动机替换为外在动机。外在奖励撤除后，动机不复存在。

Duolingo 的教训： - 连续打卡（streak）机制：长期用户的核心动机从"学语言"漂移到"不断条"——这是 SDT 所说的"控制性动机"取代"自主性动机"。 - 用户反馈研究（Hkust 2022，Duolingo 论坛内容分析 + 15 人访谈）：游戏化误用的三大原因——竞争性、过度沉迷于娱乐性、从众（herding）。 - "最短可行课程"问题：连续打卡激励下，理性策略是每天完成最短最容易的课——维持打卡但无学习价值。 - 研究发现：以维持 streak 为主要动机的用户，六个月后学习留存显著低于以真实语言兴趣为驱动的用户（控制总使用时间后该差异依然显著）。

来源：When Gamification Spoils Your Learning - arxiv 2203.16175；Datafield.dev Case Study Duolingo

4.2 游戏化何时有效（正向反证）

积极反馈（表扬、提示进步）可显著提升内在动机（Deci 1971，被 SDT 体系引用）；
自主感和胜任感维度的游戏化（而非控制和竞争）与留存正相关；
Tsay et al. & Bishtref 2019 纵向研究（333名学生，3年）：第二年游戏化学生参与度高于第一年，说明克服新颖性衰减是可能的——关键在于让互动有意义而非维持指标。
EFL 研究（Duolingo 用户，2026，印尼）：当学习者感知到"享受和有意义"时，游戏化确实促进了内在动机的内化——条件是设计导向自主而非控制。

结论：表扬/进度反馈有效；竞争性排行榜、连续打卡等控制性机制长期有害。重点是"游戏化什么"和"如何退出"。

来源：Springer gamification novelty effect longitudinal 2022

第五部分：新颖性效应（Novelty Effect）

5.1 EdTech 的"蜜月期"

几乎所有教育技术创新都伴随新颖性效应： - 引入后 2-4 周内，参与度和热情显著高于基准； - 随后开始衰减，通常在 4-10 周内效果减半甚至归零（Springer Nature gamification 14周研究，2022）；

这直接导致 RCT 结果被污染：如果研究期短于 3-4 个月，正效应可能只是新鲜感，而非真实学习效果。

5.2 对 AI 学习产品的含义（推测）

推测（尚无直接 RCT 证据）： - AI 原生教育产品（包括生成式 AI 辅导）极可能出现同样的新颖性效应。 - 建议：AI 版可汗学院早期 DAU/留存数据需谨慎解读，至少跟踪 3 个月以上才能区分新颖性与真实留存。

来源：Springer novelty effect gamification 2022；Frontiers Education gamification novelty 2023

第六部分：AI 不加护栏会直接伤害学习（Bastani et al. 2024/2025 PNAS）

这是对本项目最直接的已验证实证：

实验设计：约 1000 名高中生数学课，随机分配到三组： 1. 控制组（无 AI） 2. GPT Base（类 ChatGPT 界面，无限制） 3. GPT Tutor（加了"给提示而非直接答案"护栏）

结果： - 练习时表现：GPT Base +48%，GPT Tutor +127%（vs 控制组）——AI 确实大幅提升即时表现。 - 考试时（无 AI 辅助）：GPT Base 比控制组 低 17%；GPT Tutor 与控制组无显著差异。 - 学生行为分析：GPT Base 学生直接索取并抄写答案；GPT Tutor 学生更多独立尝试然后要求帮助。 - 学生自我认知盲区：GPT Base 学生不认为自己学习受损——他们不知道自己在走捷径。

结论（已验证）："护栏式解题流"（AI 不直接给答案、给提示、引导思考）是必须的设计约束，不是可选的特性。

来源：Bastani et al. PNAS 2025；SSRN 2024 Working Paper*

第七部分：行为科学干预在规模化时的效果衰减

Reich et al. (2020, PNAS) 在 247 门 Harvard/MIT/Stanford 课程、25万名学生上测试多种行为科学干预（自我调节提醒、价值相关性信息等）： - 自我调节干预：提升了前几周参与度，但不影响最终完成率。 - 价值相关性干预：仅在存在"全球差距"的课程中、面向发展中国家学生时有效；一旦情境不匹配，效果消失。 - 核心结论：在多样化情境中规模化时，平均效果比单一研究小 10 倍（数量级差距）。

来源：Scaling behavioral science interventions - PNAS 2020

综合分析：根因清单与有效干预清单

A. 学生不学的根因清单

#	根因	机制	证据强度
R1	低自我调节能力（SRL）	缺乏目标设定、时间管理、元认知监控，在无结构环境中迅速放弃	强（多项 RCT 和大样本研究）
R2	动机三需要未满足（SDT）	感知不到自主感（被迫学）、胜任感（太难/太易）、归属感（孤独）→ 动机外化或消失	强（SDT 体系有大量 RCT）
R3	社交孤立与无问责	一个人学没有问责闭环，孤独触发倦怠，无教师关注 → 退出	强（多项 RCT）
R4	青少年认知/元认知尚未成熟	12-16 岁延迟满足、目标坚持等执行功能尚在发育，无外部结构容易放弃	强（发展心理学实证）
R5	马太效应——弱势学生获益最少	高 SRL 学习者越学越强，低 SRL/弱势学习者越学越迷失	强（大样本纵向+准实验）
R6	启动失败（52%注册者从未开始）	注册与学习之间的冷启动门槛极高，意向与行动存在巨大"意图-行为鸿沟"	强（edX 6年数据）
R7	游戏化走向反噬	连续打卡等控制性机制侵蚀内在动机，学生为打卡而学，内在兴趣消亡	中-强（SDT 实验+用户行为分析）
R8	新颖性效应掩盖真实留存	初期高参与度来自新鲜感，4-10 周后迅速衰减，产品误判真实效果	中（纵向设计研究）
R9	AI 直接给答案制造学习幻觉	学生即时表现好，但真实学习受损（-17%），且学生无自我察觉	强（PNAS RCT，~1000 人）
R10	行为干预规模化效果衰减 10 倍	单一情境有效的干预在多元情境下效果骤降	中-强（25万学生跨 247 门课）

B. 已被证明能提升坚持度的有效干预清单

#	干预手段	效果	证据强度	最佳设计原则
I1	脚手架支持（Scaffolding）	在线学习表现总体效果量 ES=0.53（meta分析，32项研究）	强	提供引导结构，逐步撤退
I2	SRL 干预（目标设定、自我监控、策略反馈）	学业成绩效果量 ES=0.69（meta分析，在线+混合场景）	强	明确学习目标和进度可视化
I3	归属感/社交连结干预	RCT：弱势学生两年持续就读率显著提升（Science Advances，N=1063）	强	定制化、具体化地传递"你属于这里"
I4	社交互动设计（讨论板、一对一交流）	一对一讨论后次周完成率+10%（N=30,317，3项随机实验）	强	同伴互动质量高于数量
I5	护栏式 AI 辅导（提示而非答案）	练习+127%、考试与控制组无显著差异（GPT Tutor vs GPT Base -17%）	强（PNAS RCT）	禁止直接给答案，必须给提示
I6	教师临场感（个性化消息/存在感）	满意度和感知学习显著提升，建立师生联结	中（部分研究存在感知vs真实差异）	个人化、定期、真实
I7	成长型思维与自我效能干预	对弱势学生 GPA 提升有帮助（密歇根州立 RCT）；但规模化效果衰减	中（情境依赖）	需配合具体学科内容
I8	同伴导师（Peer Mentoring）	RCT：提升动机、学习行为、考试报名；优等生效果最强	中-强（德国大学 RCT）	聚焦自我管理而非知识本身
I9	价值相关性干预（告知知识的现实意义）	在"存在全球学习差距"的课程中，对发展中国家学生完成率有效	中（情境依赖）	必须真实相关，不能泛泛
I10	积极反馈/进度可视化（非竞争性）	增强胜任感，维持内在动机，避免过度理由效应	中-强	反馈聚焦进步而非排名

正向反证：哪些设计确实留住了学生？

综合有效设计特征（跨多项 RCT）：

"高科技 + 高温情"（High Tech, High Touch）：Project COMPASS RCT 证明，在线课程加入教学临场感、社交临场感、认知临场感的综合重设计，少数族裔学生通过率显著提升，且提高了下一年留存。来源：Sci-Direct High Tech High Touch RCT
第一、二周是关键：参与度下滑主要在第一周，第一二周留住学生后曲线趋于平稳（斯坦福 CEPA）。→ 冷启动设计极为关键。
早期结构化承诺：事先填写"何时学习"的学生持续率显著更高（J-PAL 研究）。
归属感来自具体而真实的联结：抽象的"欢迎语"无效；个人化消息、连接课程内容与学生生活经历的周度沟通有效（Sara Avila Forcada 实验，AEA P&P 2023，改善成绩和评价）。
掌握式学习（Mastery Learning）的胜任感效应：当学生感到"我真的会了"，内在动机得到强化，这是与打卡留存（空洞留存）根本不同的良性循环。

对"AI 版可汗学院"的具体风险与设计启示

核心风险点

目标群体（低自律/弱势初高中生）是最脆弱群体：SRL 最弱、最需要帮助的孩子，恰恰是从自学平台获益最少的人（马太效应）——这是本项目必须系统性破解的结构矛盾。
冷启动问题：52% 注册者从未开始。产品第一周的设计如同急诊室：必须极快建立连结和胜任感。
游戏化陷阱：若以"连续打卡/积分/排行榜"作为主要留存手段，3-6 个月后将面临内在动机被消费殆尽的问题（Duolingo 案例）。
AI 直接答题风险：如不做护栏，学生会把 AI 当抄答案机器，练习表现好但真实学力受损（Bastani PNAS）。
新颖性效应掩盖真实留存：前 4-8 周数据可能虚高，需要至少 3 个月跟踪才能看到真实留存曲线。
规模化干预效果衰减：有效的个性化干预在规模化时平均效果降为 1/10（Reich et al. PNAS 2020），需持续 A/B 测试和分人群迭代。

设计建议（基于实证）

护栏式解题流是非可选项：苏格拉底式追问 → 提示 → 步骤分解，禁止直答。这既是学习科学要求，也有 PNAS 级别 RCT 支撑。
第一周留存设计：快速建立胜任感（调适内容难度至成功体验）+ 人工问候/教师 touch（哪怕是半自动化）。
社交化问责闭环：引入同伴学习小组或家长可见进度报告，提供外部问责锚点（尤其对低 SRL 学生）。
SRL 脚手架内嵌：目标设定向导、每周学习计划、反思提示——不能假设学生有 SRL，必须在产品里教。
反竞争游戏化：避免排行榜、避免破损 streak 惩罚感，改用进步可视化（展示"我比自己上周好了多少"）。
归属感设计：具体、真实、定期的个人化连结（展示"像你一样的同学也在学"），比通用"欢迎"语有效。

不确定项与推测说明

项目	状态	说明
AI 原生教育产品的新颖性效应持续时长	推测	尚无专门 RCT 数据，推测与其他EdTech类似，需产品自行追踪
中国初高中特定人群的 SRL 基线数据	数据有限	中文文献多为疫情期间数据，代表性有待确认
"掌握式学习 + AI"组合对留存的长期效果	尚无高质量 RCT	Khanmigo 等产品早期数据乐观但样本小、周期短
同伴导师（Peer Mentoring）对初高中生（vs大学生）的效果迁移	推测	目前 RCT 主要在大学生群体，初高中迁移有待验证
行为干预在中国教育文化情境下的效果差异	未知	西方研究为主，文化适配尚需在地化 RCT

参考来源

Jordan (2015). MOOC completion rates data visualization — 支撑 MOOC 完成率 ~15% 结论
Jordan (2014/2015). MOOC Completion Rates Revisited - ERIC EJ1067937 — 支撑中位数 12.6%、0.7%-52.1% 区间
Reich & Ruipérez-Valiente (2019). The MOOC Pivot. Science 363(6423) — 支撑"52%注册者从未开始"、"完成率六年无改善"、"富裕国家集中"等核心结论
Springer Nature (2022). Role of motivation in MOOCs' retention rates: systematic review — 支撑 SDT 是最广泛使用的 MOOC 动机理论框架
Wang et al. (2024). SDT-based interventions meta-analysis. selfdeterminationtheory.org — 支撑 SDT 干预效果量数据
PMC (2022). Take a MOOC and then drop: systematic review — 支撑辍学归因两大类因素
CEPA Stanford Working Paper No.15-09 (2015) — 支撑第一二周是关键留存窗口
Bastani et al. (2024/2025 PNAS). Generative AI Can Harm Learning — 支撑 AI 无护栏 -17%、护栏消除伤害的核心结论
Saleh & Sanders. The Wolf in Sheep's Clothing: Matthew Effect in Online Education — 支撑在线教育马太效应论证
ITS AdaptiveMath Australia 2025 (eprints.soton.ac.uk) — 支撑 ITS 平台可能放大不平等的大样本实证
Sanna Oinas (2025). Self-Regulation of E-learning: Mixed Method Study — 支撑 SRL 最低组 50% "什么都没学到"结论，N=29,863
Arxiv 2203.16175 (2022). When Gamification Spoils Your Learning — 支撑游戏化误用与过度理由效应
Springer gamification novelty effect longitudinal 14-week study (2022) — 支撑新颖性效应 4-10 周内衰减
Social Presence meta-analysis - Computers in Human Behavior (2017) — 支撑社交临场感与满意度和学习的相关性
SSRN - Social Interaction MOOC RCT (30,317 students) — 支撑一对一讨论提升完成率 10%
Reich et al. (2020, PNAS). Scaling behavioral science interventions — 支撑规模化后效果衰减 10 倍
Springer Current Psychology (2023). SRL, metacognition, EF transitions — 支撑初高中阶段 SRL 和 EF 发展不成熟
Science Advances (2020). Belonging intervention improves retention — 支撑归属感干预提升两年持续就读率
High Tech High Touch RCT (2020, SciDirect) — 支撑综合临场感重设计 RCT
Scaffolding meta-analysis MDPI (2023, 32项研究 ES=0.53) — 支撑脚手架对在线学习的效果
SRL interventions meta-analysis online/blended K-12 & HE (ResearchGate, ES=0.69) — 支撑 SRL 干预效果量
Erlangen peer mentoring RCT (laser.uni-erlangen.de) — 支撑同伴导师提升动机与学习行为