调研报告：AI 版可汗学院——大规模内容共创与协作生产模式

任务：为中国公益开源教育项目调研大规模内容共创/协作生产模式（含教师共创、分层、AI 辅助、激励治理）。

一、标杆案例

1. Khan Academy 内容流水线 + 国际化众包翻译

核心内容（视频/题/文章）由内部全职专家团队生产。来源：https://www.khanacademy.org/about/the-team
国际化靠「语言倡导者（Language Advocates）」体系，覆盖 40+ 语言。来源：https://medium.com/buildimpact/ive-already-had-several-careers-and-at-this-point-i-just-want-to-do-good-work-1f5852ca8a43
本地化话题树（LTT）：各语言团队拥有内容独立副本，自主决定何时接受英文更新——保障本地课标对齐。来源：https://support.khanacademy.org/hc/en-us/articles/115007975488-String-Translations-A-Guide-for-Volunteers
借鉴：语言倡导者体系 + LTT → "学科负责人体系 + 知识图谱本地副本"。
局限：原始内容创作不开放给社区（仅翻译/本地化开放）。

2. CK-12 FlexBook 协作教材

"平台提供基础，教师 Fork 并定制（CC 授权）"，已创建 115,000+ FlexBooks。来源：https://opensource.com/education/16/1/ck-12-open-education-resources 局限：分叉式（非实时协作）；质量不均；定制功能少人用。来源：https://opened.co/tools/ck-12-foundation

3. Wikipedia 分层编辑与审核

用户权限分层：匿名→注册→自动确认（4天+10编辑）→扩展确认（30天+500编辑）→Reviewer→Admin。来源：https://en.wikipedia.org/wiki/Wikipedia:Quality_control
Flagged Revisions（德语维基）：两级 flag — Sighted（去破坏）/ Quality（内容审查）；新用户编辑需审核后才公开，平均等 15 天。来源：https://meta.wikimedia.org/wiki/Flagged_Revisions
Pending Changes（英语维基，高风险页）。来源：https://en.wikipedia.org/wiki/Wikipedia:Pending_changes
借鉴：用户分层+权限升级路径；两级 flag（防破坏 vs 教学质量）。
局限：教育内容有唯一正确答案，需要更强学科权威，不能纯靠社区共识。

4. Rebus Community 开放教材出版（最成熟的分角色协作）

角色：Champion / Project Manager / Author / Substantive Editor（学科专家审内容正确性） / Copy Editor / Peer Reviewer（评审即采用者） / Accessibility Coordinator / Coordinator。来源：https://press.rebus.community/the-rebus-guide-to-publishing-open-textbooks/chapter/roles-responsibilities 关键洞察：评审人往往成为最终采用者——评审即加入，是留人机制。

5. OER Commons 质量标准

维度：事实准确性、诚实性、包容性、无障碍、设计质量。同行评审可在创建前/生产中/发布前三节点。来源：https://help.oercommons.org/support/solutions/articles/42000107074 ；https://caul.libguides.com/oer-collective-publishing-workflow/review/conduct-peer-review

6. 中国政策背景（2025-2026）

教育部 2026-04《"人工智能+教育"行动计划》：建"人工智能学习社区"，"语料共建、模型共测、应用共创"；上交大牵头"启悟学习社区"；2025 国务院意见"开源贡献纳入学分认证和教师成果认定"。来源：https://www.edu.cn/xxh/focus/zc/zc/202604/t20260413_2727796.shtml 推测：政策窗口为公益定位提供有利环境，高校合作或为获取教师资源的低成本路径。

二、分层协作模型

结论：强烈建议分层，层级与"权威性"强绑定。 理由：教育内容错误代价极高；贡献者能力金字塔分布；扁平开放编辑在质量敏感领域需额外机制。

最适合教育内容的分层逻辑：

层级	角色	产出	能力门槛
L0	知识架构师（1-3人）	知识图谱+课标对齐+核心概念	最高
L1	学科专家贡献者（每学科可多名）	核心讲解内容	高
L2	题目贡献者（20-100）	练习题+变式+解析	中
L3	AI 生成+人工审核	互动/题目草稿	低
L4	学习者社区（无限）	勘误、难度反馈、优秀题解	极低

成熟工作流参考：德语维基 FlaggedRevs（Draft→Pending→Sighted→Quality→公开）；Rebus OER（提案→起草→实质编辑→同行评审→文字编辑→无障碍→发布→迭代）。

三、AI 辅助共创（2025-2026 工具与效率）

工具：MagicSchool AI（80+ 工具）https://www.magicschool.ai ；Khanmigo for Teachers https://www.khanmigo.ai ；Diffit；Brisk Teaching；Curriculum Curator（开源，"提案/应用"模式）https://github.com/michael-borck/curriculum-curator

效率数据（已验证）： - 83% K-12 教师 2023-24 用 AI 辅助。来源：https://ideausher.com/blog/magic-school-ai-like-teacher-tool-development - MagicSchool 2025 使用量 +87%。来源：https://www.magicschool.ai/blog-posts/most-used-classroom-ai-tools-2025 - AI 可承担教师 45% 例行工作；题目生成省 90%+ 时间。来源：https://aristeksystems.com/blog/ai-powered-learning-key-statistics-on-its-growing-impact - Forasoft ALDA：课标 RAG+教师审核循环，重写率 60%→15%，课程开发 6-8 周→10 天。来源：https://www.forasoft.com/blog/article/automated-lesson-plan-generation-software - 人类-AI 协作标注（MDPI 2026）：AI 草稿+人审核大幅提吞吐量保质量。来源：https://www.mdpi.com/1099-4300/28/4/377

关键洞察：审核行为本身在生产训练数据——老师每次修改都在优化 AI 下次生成，是正向飞轮。

四、激励与治理（非营利/开源）

有效激励（来源：https://opensource.guide/leadership-and-governance）：① 署名/可见度（最强）② 能力认证（配合教育部政策）③ 微酬（象征性）④ 社群归属 ⑤ "用而受益"正循环 ⑥ 渐进式准入。

质量门控：永远保持"稳定版本"公开可见，在制内容进 Staging；作者不能审自己内容；设客观可验证质量门（题必附答案、标知识点、对齐课标）；Revert 成本低。 Alexandrian Academy 状态机：draft→proposed→reviewed→accepted→deprecated。来源：https://github.com/SocioProphet/alexandrian-academy 治理模型：仁慈独裁者（BDFL）+ 分领域委托——L0 核心团队定标准不投票；L1 分学科委托资深老师审核有决定权；L3-L4 完全开放，AI 辅助过滤+晋升通道。

五、GitHub PR 式教育内容共创

已有实践：教授用 PR 管理课程大纲（Daniel Shiffman "Nature of Code" 被 fork 287 次）；Alexandrian Academy 实现版本化+Sandbox/Canon 分区。来源：https://investigating-archiving-git.gitlab.io/updates/git-for-education

映射流程：学科负责人建 repo → 贡献者 Fork+Branch → 提交 PR（附知识点/难度/课标/解析元数据）→ 自动检查 → 人工审核 → Merge 进 Staging（学生预览）→ 社区反馈 2 周 → Promote 到 Canon。 关键适配：教育内容不可自动测试，但可设"机器可检查必填字段"降审核负担（知识图谱节点 ID、≥1 条解析、年级难度标注）。学生共创（推测）：贡献"被验证题解"（3 位老师点赞合并）、类比、难度反馈。

六、三个候选「分层共创工作流」

方案 A 维基式：开放社区+渐进权限+内容状态机。最开放最低门槛，但审核负担线性增长、去权威化或降信任。
方案 B GitHub PR 式：PR 协作+AI 前置过滤。版本管理成熟可追溯，但 Git 对非技术老师有门槛（需 Web 界面封装）。
方案 C 分层委托制（推荐）：Rebus 角色 + Khan 语言倡导者 + Forasoft AI 辅助。L0 核心团队 / L1 学科负责人（每学科可多名）/ L2 内容贡献者 / L3 审核志愿者 / L4 学习者社区。最适合非营利公益、志愿者为主、内容质量是品牌信任基础的本项目。

七、风险点（按优先级）

协作稀释质量（最高）：坚持"稳定版本"机制；L1 审核不可绕过；AI 内容显式标注。
志愿者流失（高）：聚焦留住 10-20 名高质量 L1/L2；早期把贡献者工具体验放首位。
中国课标复杂性（中）：多版教材，需明确标注适用版本，参考 LTT 机制。
GitHub 门槛（中）：上层包 Web 编辑器，底层 Git，老师无感知。
AI 幻觉（中）：AI 内容显式标注；数学引入符号计算自动验答。