在使用Google DeepMind的Gemini引导式学习系统12小时后,学生数学成绩平均提升0.258个标准差,相当于1.2至1.7年的学习进度;但基础更好的学生获益更大,这引发了关于加剧教育差距的担忧。 对超过11.3万次学生与AI的互动分析显示,91.4%的对话聚焦于概念理解,而Gemini仅在2.1%的情况下直接提供答案,证明其主要用于启发式教学,而非“答案机器”。

Create a landscape editorial hero image for this Studio Global article: Searching for What were the design, results, and key findings of the randomized controlled trial in Sierra Leone (involving 1,763 Grade 7 an. Article summary: Here is the complete summary of the Sierra Leone randomized controlled trial testing Google DeepMind and Fab AI's Gemini Guided Learning, based on the technical report [1] and supporting coverage [2][4][5][8].. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "#### *R4D’s Evaluation and Adaptive Learning team partnered with Rising Academy Network to design, test, and improve a low-cost, scalable literacy intervention for their growing ne" source context "Using adaptive learning to measure and improve literacy rates in Sierra Leone | Results for Development" Reference image 2: vis
人工智能在教育领域的潜力巨大,但在真实课堂中衡量其影响的严谨证据一直很稀缺。2026年6月,Google DeepMind 与教育非营利组织 Fab AI 公布了在塞拉利昂进行的一项里程碑式随机对照试验的结果,为我们提供了迄今为止关于AI学习工具如何与教师协同作用最详尽的图景之一 。
研究发现,将Gemini的“引导式学习”模式融入数学课堂,显著提高了学生的考试成绩。然而,结果也揭示了一些关键的细微之处:原本数学成绩就领先的学生获益最多,教师的角色需要发生转变,而且这项精心设计的干预措施很难剥离其配套支持组件的效果。
这项试验与塞拉利昂教育部合作,是一项预先注册的双臂整群随机对照试验。试验为期八周,从 2025年10月6日至12月5日,在洛科港区的12所政府支持的初中进行 。
研究招募了 1763名七、八年级学生(年龄13岁及以上),分布在 48个数学课堂 中 。在每所学校和每个年级内部,班级被随机分配为使用Gemini引导式学习的实验组,或继续接受标准教学的对照组。为避免AI工具的效果与教师质量混淆,所有教师都接受了相同的5-6小时培训
。
试验设定的目标剂量是学生在每周四节数学课中,用两节课的时间使用AI工具,在八周内总计完成 12小时的引导式学习 。
这项干预并非简单地把一个聊天机器人扔给学生。它遵循一套严格的教学法框架,旨在让AI成为协作学习过程中的伙伴:
在准备阶段,教师需要定义课程目标,撰写起始提示,并在黑板上草拟问题框架,为学生与Gemini的互动搭建好“脚手架” 。
该试验取得了统计上显著的效果,但影响的程度在很大程度上取决于学生使用工具的频率及其初始水平。
这项研究最具揭示性的部分之一,是对超过 11.3万次学生与Gemini互动记录 的分析。它描绘出AI并非“答案机器”,而是一位“辅导老师”。
绝大多数对话——91.4%——集中在数学理解上 。Gemini自身的行为也被引导式学习功能精心驾驭:它发送的消息中有 76.4%是启发式提问,促使学生独立思考;而直接提供解决方案的情况仅占 2.1%
。
关于初始成绩好的学生获益最多的发现,促使研究者发出了一个重要的警示。如果没有针对性的策略来支持基础较差的学生,这种干预措施可能面临 拉大现有成绩差距 的风险,而非缩小它 。
来自教师焦点小组的定性反馈为结果增加了另一个维度。教师们报告说,学生的参与度明显提高,课堂参与更加积极 。许多教师开始用Gemini来备课,发现了讲解分数等复杂题目的新方法
。
更重要的是,教师们描述了自己职业身份的转变,感觉自己的角色从“讲师”演变成了 “引导师” ,在教室中来回走动,为各个学生小组提供支持 。
但并非所有反馈都是积极的。一些教师也提到了挑战,包括Gemini偶尔会引入与主题无关的内容,或者拖慢了整个班级按计划完成教学大纲的进度 。
尽管结果是积极的,研究人员仍谨慎地指出了几个必须正视的局限性,便于读者全面理解这些发现:
塞拉利昂的试验仅仅是个开始。这是Google DeepMind和Fab AI计划中的 国际系列预注册试验的首个,旨在研究引导式学习在不同教育系统中的应用 。为了提升透明度和可推广性,双方在发布结果的同时,公开了他们的 教师培训材料 和一份 快速随机对照试验操作手册,为其他研究者和教育系统提供了蓝图
。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
在使用Google DeepMind的Gemini引导式学习系统12小时后,学生数学成绩平均提升0.258个标准差,相当于1.2至1.7年的学习进度;但基础更好的学生获益更大,这引发了关于加剧教育差距的担忧。
在使用Google DeepMind的Gemini引导式学习系统12小时后,学生数学成绩平均提升0.258个标准差,相当于1.2至1.7年的学习进度;但基础更好的学生获益更大,这引发了关于加剧教育差距的担忧。 对超过11.3万次学生与AI的互动分析显示,91.4%的对话聚焦于概念理解,而Gemini仅在2.1%的情况下直接提供答案,证明其主要用于启发式教学,而非“答案机器”。
这项研究设计无法分离AI工具本身的独立效应,因为它捆绑了教师培训、结构化教案和设备支持;此外,研究样本仅来自塞拉利昂一个区,不具备全国代表性。
Loading comments...
Comments
0 comments