大规模内容共创与协作生产模式调研

2026-06-02

调研报告:AI 版可汗学院——大规模内容共创与协作生产模式

任务:为中国公益开源教育项目调研大规模内容共创/协作生产模式(含教师共创、分层、AI 辅助、激励治理)。


一、标杆案例

1. Khan Academy 内容流水线 + 国际化众包翻译

  • 核心内容(视频/题/文章)由内部全职专家团队生产。来源:https://www.khanacademy.org/about/the-team
  • 国际化靠「语言倡导者(Language Advocates)」体系,覆盖 40+ 语言。来源:https://medium.com/buildimpact/ive-already-had-several-careers-and-at-this-point-i-just-want-to-do-good-work-1f5852ca8a43
  • 本地化话题树(LTT):各语言团队拥有内容独立副本,自主决定何时接受英文更新——保障本地课标对齐。来源:https://support.khanacademy.org/hc/en-us/articles/115007975488-String-Translations-A-Guide-for-Volunteers
  • 借鉴:语言倡导者体系 + LTT → "学科负责人体系 + 知识图谱本地副本"。
  • 局限:原始内容创作不开放给社区(仅翻译/本地化开放)。

2. CK-12 FlexBook 协作教材

"平台提供基础,教师 Fork 并定制(CC 授权)",已创建 115,000+ FlexBooks。来源:https://opensource.com/education/16/1/ck-12-open-education-resources 局限:分叉式(非实时协作);质量不均;定制功能少人用。来源:https://opened.co/tools/ck-12-foundation

3. Wikipedia 分层编辑与审核

  • 用户权限分层:匿名→注册→自动确认(4天+10编辑)→扩展确认(30天+500编辑)→Reviewer→Admin。来源:https://en.wikipedia.org/wiki/Wikipedia:Quality_control
  • Flagged Revisions(德语维基):两级 flag — Sighted(去破坏)/ Quality(内容审查);新用户编辑需审核后才公开,平均等 15 天。来源:https://meta.wikimedia.org/wiki/Flagged_Revisions
  • Pending Changes(英语维基,高风险页)。来源:https://en.wikipedia.org/wiki/Wikipedia:Pending_changes
  • 借鉴:用户分层+权限升级路径;两级 flag(防破坏 vs 教学质量)。
  • 局限:教育内容有唯一正确答案,需要更强学科权威,不能纯靠社区共识。

4. Rebus Community 开放教材出版(最成熟的分角色协作)

角色:Champion / Project Manager / Author / Substantive Editor(学科专家审内容正确性) / Copy Editor / Peer Reviewer(评审即采用者) / Accessibility Coordinator / Coordinator。来源:https://press.rebus.community/the-rebus-guide-to-publishing-open-textbooks/chapter/roles-responsibilities 关键洞察:评审人往往成为最终采用者——评审即加入,是留人机制。

5. OER Commons 质量标准

维度:事实准确性、诚实性、包容性、无障碍、设计质量。同行评审可在创建前/生产中/发布前三节点。来源:https://help.oercommons.org/support/solutions/articles/42000107074 ;https://caul.libguides.com/oer-collective-publishing-workflow/review/conduct-peer-review

6. 中国政策背景(2025-2026)

教育部 2026-04《"人工智能+教育"行动计划》:建"人工智能学习社区","语料共建、模型共测、应用共创";上交大牵头"启悟学习社区";2025 国务院意见"开源贡献纳入学分认证和教师成果认定"。来源:https://www.edu.cn/xxh/focus/zc/zc/202604/t20260413_2727796.shtml 推测:政策窗口为公益定位提供有利环境,高校合作或为获取教师资源的低成本路径。


二、分层协作模型

结论:强烈建议分层,层级与"权威性"强绑定。 理由:教育内容错误代价极高;贡献者能力金字塔分布;扁平开放编辑在质量敏感领域需额外机制。

最适合教育内容的分层逻辑:

层级 角色 产出 能力门槛
L0 知识架构师(1-3人) 知识图谱+课标对齐+核心概念 最高
L1 学科专家贡献者(每学科可多名) 核心讲解内容
L2 题目贡献者(20-100) 练习题+变式+解析
L3 AI 生成+人工审核 互动/题目草稿
L4 学习者社区(无限) 勘误、难度反馈、优秀题解 极低

成熟工作流参考:德语维基 FlaggedRevs(Draft→Pending→Sighted→Quality→公开);Rebus OER(提案→起草→实质编辑→同行评审→文字编辑→无障碍→发布→迭代)。


三、AI 辅助共创(2025-2026 工具与效率)

工具:MagicSchool AI(80+ 工具)https://www.magicschool.ai ;Khanmigo for Teachers https://www.khanmigo.ai ;Diffit;Brisk Teaching;Curriculum Curator(开源,"提案/应用"模式)https://github.com/michael-borck/curriculum-curator

效率数据(已验证): - 83% K-12 教师 2023-24 用 AI 辅助。来源:https://ideausher.com/blog/magic-school-ai-like-teacher-tool-development - MagicSchool 2025 使用量 +87%。来源:https://www.magicschool.ai/blog-posts/most-used-classroom-ai-tools-2025 - AI 可承担教师 45% 例行工作;题目生成省 90%+ 时间。来源:https://aristeksystems.com/blog/ai-powered-learning-key-statistics-on-its-growing-impact - Forasoft ALDA:课标 RAG+教师审核循环,重写率 60%→15%,课程开发 6-8 周→10 天。来源:https://www.forasoft.com/blog/article/automated-lesson-plan-generation-software - 人类-AI 协作标注(MDPI 2026):AI 草稿+人审核大幅提吞吐量保质量。来源:https://www.mdpi.com/1099-4300/28/4/377

关键洞察:审核行为本身在生产训练数据——老师每次修改都在优化 AI 下次生成,是正向飞轮。


四、激励与治理(非营利/开源)

有效激励(来源:https://opensource.guide/leadership-and-governance):① 署名/可见度(最强)② 能力认证(配合教育部政策)③ 微酬(象征性)④ 社群归属 ⑤ "用而受益"正循环 ⑥ 渐进式准入。

质量门控:永远保持"稳定版本"公开可见,在制内容进 Staging;作者不能审自己内容;设客观可验证质量门(题必附答案、标知识点、对齐课标);Revert 成本低。 Alexandrian Academy 状态机:draft→proposed→reviewed→accepted→deprecated。来源:https://github.com/SocioProphet/alexandrian-academy 治理模型:仁慈独裁者(BDFL)+ 分领域委托——L0 核心团队定标准不投票;L1 分学科委托资深老师审核有决定权;L3-L4 完全开放,AI 辅助过滤+晋升通道。


五、GitHub PR 式教育内容共创

已有实践:教授用 PR 管理课程大纲(Daniel Shiffman "Nature of Code" 被 fork 287 次);Alexandrian Academy 实现版本化+Sandbox/Canon 分区。来源:https://investigating-archiving-git.gitlab.io/updates/git-for-education

映射流程:学科负责人建 repo → 贡献者 Fork+Branch → 提交 PR(附知识点/难度/课标/解析元数据)→ 自动检查 → 人工审核 → Merge 进 Staging(学生预览)→ 社区反馈 2 周 → Promote 到 Canon。 关键适配:教育内容不可自动测试,但可设"机器可检查必填字段"降审核负担(知识图谱节点 ID、≥1 条解析、年级难度标注)。 学生共创(推测):贡献"被验证题解"(3 位老师点赞合并)、类比、难度反馈。


六、三个候选「分层共创工作流」

  • 方案 A 维基式:开放社区+渐进权限+内容状态机。最开放最低门槛,但审核负担线性增长、去权威化或降信任。
  • 方案 B GitHub PR 式:PR 协作+AI 前置过滤。版本管理成熟可追溯,但 Git 对非技术老师有门槛(需 Web 界面封装)。
  • 方案 C 分层委托制(推荐):Rebus 角色 + Khan 语言倡导者 + Forasoft AI 辅助。L0 核心团队 / L1 学科负责人(每学科可多名)/ L2 内容贡献者 / L3 审核志愿者 / L4 学习者社区。最适合非营利公益、志愿者为主、内容质量是品牌信任基础的本项目

七、风险点(按优先级)

  1. 协作稀释质量(最高):坚持"稳定版本"机制;L1 审核不可绕过;AI 内容显式标注。
  2. 志愿者流失(高):聚焦留住 10-20 名高质量 L1/L2;早期把贡献者工具体验放首位。
  3. 中国课标复杂性(中):多版教材,需明确标注适用版本,参考 LTT 机制。
  4. GitHub 门槛(中):上层包 Web 编辑器,底层 Git,老师无感知。
  5. AI 幻觉(中):AI 内容显式标注;数学引入符号计算自动验答。