如今,AI已经以前所未见的速度,迅速融入大学生的学习和生活,越来越多人开始体会到,从「有痛学习」变成「无痛学习」是什么感受。最近一个新闻曝出,眼看着要开学,成都的一位小孩哥,用AI量产手抄报,疯狂赶暑假作业。无论你的态度是拥抱还是迟疑,无可否认的是,如今AI已经在深刻影响着教育领域。从小学生到大学生,无一能逃过这场大潮。原因就在于,教育应该是千人千面的,但老师却不可能无时无刻地关注到每一个学生,而AI,则完全打破了现实中的桎梏。而且,得益于LLM、AIGC等前沿技术实现,传统的自适应教育已经逐渐进化为更加智能化的「智适应」学习。在国外,一些代表性教育机构看准契机,纷纷在智适应教育中布局。比如,Duolingo Max采用了角色扮演技术,让学生可以通过模拟情景与AI进行对话。Khanmigo利用个性化LLM对话的形式平台,通过不断提问的方式,帮助学生构建知识,提供个性化教学,最终答疑解惑。吴恩达的Coursera以开放式在线课程为基础,提供的是在线智适应学习课程和混合学习的模式。显而易见,智适应教育方式,正在成为AI教育领域界的共识。恰巧,在刚刚结束不久的ACM KDD 2024上,闭幕式的重磅圆桌讨论环节,聚焦的正是GenAI+教育。席间,圣母大学教授、AAAS/AAAI/ACM/IEEE Fellow Nitesh Chawla,明尼苏达大学教授、IEEE Fellow George Karypis、松鼠Ai联合创始人梁静博士,美国东北大学教授、ACM/IEEE Fellow Ricardo Baeza-Yates四人,一起在台上探讨了生成式AI的未来方向,以及潜在的创新应用。不仅如此,松鼠Ai研发团队在KDD主会上,发表了一篇关于LLM,尤其是教育大模型,在时间序列分析中应用的论文。他们还组织了Workshop,并在GenAI Day上发表了主题演讲。众所周知,作为全球数据挖掘领域历史最悠久、规模最大的国际顶会,也是国内评级的A类学术会议,KDD每年都会吸引数千名来自世界各地的顶尖学者、企业代表参会。而在这样的国际顶会上,鲜有企业能够参与到学术论坛的讨论当中。可见,这次被大会邀请前来做客同时还在会上发布论文的松鼠Ai,在AI教育领域是有真才实学的。那么问题来了,这些大佬,对当前AI发展是怎么看的?
很多年前,AI还没有像现在这么流行,当时公司经受了许多怀疑——为什么要在教育中使用AI?能用它做什么?如今,所有人都在思考,如何用生成式AI来帮助我们。如果只是想利用这些工具快速赚钱,在短时间内迅速成立公司的话,这种心态其实是非常危险的。但如果我们能以智慧的方式利用这项技术,比如用它进行数据分析,帮助学生更好地学习,而非快速生成内容,则是一个很有意义的机会。目前来说,我们正处于从一个阶段向另一个阶段的过渡中,走向了人与机器互动。当我们开始通过语言和多模态能力进行互动,就已经开始进入机器人工业革命。即使我们已经拥有了AI技术,有了MOOC,有了在线教育和远程学习,有了语音或语义识别,它仍然是传统的学习方式。什么是真正的个性化学习?很多人以为在ChatGPT上输入一个问题、得到答案就是个性化学习,其实并不然。对此梁静表示,关于个性化学习,大部分使用者甚至很多公司还都不真正了解,所以我们还需要很长的时间来展示什么是真正的人性化学习、智适应教育技术,让人们理解、体验、犯错、再体验…。而下一步,就将是AI、个性化学习与智适应、多模态、大模型能力的结合。基于AI的「智适应教育」,不仅可以让学生获得更高的分数,还可以让学生在相同的教学时间里培养更多能力。想象一下,在同样空间中,不同年龄的学生们围坐一周,而桌子中心没有老师。有时,需要共同完成小组作业;有时,需要合力开脑洞攻克难题。学生们仅通过互联的设备,自主学习。老师,变身成为了助教、数据分析师、情感鼓励及引导的育人的导师。这,就是智适应大模型未来应该有的样子,也是教育行业的未来。
如今的K12教育中,存在着不少弊端,这已经成为大多数人的共识。而当我们进入技术大爆炸的新时代,学校和家长希望孩子接受的,无疑是更智能化、个性化的教育。生成式AI,是否有可能在教育领域探索出更多创新的应用场景?如果能做到这一点,未来的教育方式将彻底改变,给广大学生和教育工作者带来前所未有的价值。恰巧,生成式AI的特点,和K12教育领域的应用场景是天然契合的。教育LLM通用标准:个性化学习
那么,在GenAI(生成式人工智能)赋能教育中,是否有个通用的衡量标准?而这个标准应该是什么?2022年,谷歌曾发布的一份报告中,提到了未来教育的三大趋势,其中之一便是「个性化学习」智适应。报告地址:https://edu.google.com/future-of-education/个性化学习,就是学生自主干预学习,不能有外力干扰,这对于能力培养至关重要。在这个过程中,他们会与同伴合作,也会向老师请教问题。另一份来自2021年EY报告中,如同自动驾驶一样,根据智能化程度高低,将教育分划分为L0-L5六个等级。L0很好理解,是指传统真人教学,完全没有使用自动化工具。L1典型代表是,直播课、录播课。拍照搜题等辅助工具,代表着L2。L3-L5,AI完全切入教学环节,将教学全流程数据打通,提供千人千面的教学体验。L5完全是由AI教学,意味着学生仅使用AI系统就能学习,不需要任何外部资源,其中典型代表是松鼠Ai。
具体在K12领域,已经深耕了十年之久的松鼠Ai发现,生成式AI能够通过分析学生的学习数据,动态地调整学习内容和难度。因为这种教学方式是基于数据驱动的,它不仅能提高学习效率,还能有效填补学生的知识空白,促进学生的全面发展。真正的掌握学习技能,必然是能吃透体系中的每个知识点,做到融会贯通。松鼠Ai恰恰能通过苏格拉底式的引导性提问,激发学生主动思考,深化理解,打造出更为高效、人性化的学习环境。这是因为,基于松鼠Ai独有的、所积累的2400万学生的100亿学习行为全流程数据,大模型被「喂养」后,在推荐算法、深度知识追踪等技术上都实现了突破式迭代。由此,模型能更好地捕捉数据中的复杂关系和模式,更快速发现知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系。这样,它就能更高效地绘制学生的学习画像,提供针对性的个性化服务。松鼠Ai的新版多模态智适应大模型,引入了草稿纸内容智能分析功能。通过这个功能,它能深度解析学生解题过程的每一步,精准定位题目理解、逻辑推理、计算及手写誊抄等各类错误。这样,就能确保学生和教师迅速、精准地把握问题所在,从而针对性地补足自己的弱点。这背后,得益于新版本多模态大模型在常规测评效率与准确性上的飞跃,尤其是在主观题评分上。比如这个案例中,它精准地给出了分数,详细解析了扣分点,实现了对学生学习成效的全面洞察。在智能人机交互上,全新的多模态智适应大模型也达到了全新高度。它支持文字与语音的互动模式,覆盖了100+互动对话场景。因此,如果学生在这个过程中出现困惑、开心、注意力分散等情绪变化,模型都能准确捕捉到,用时即时地给予个性化反馈与鼓励。而且,为了营造更全面且沉浸式的视听学习体验,松鼠Ai还对智能扫读笔与耳机进行了升级革新,致力于构建一个完善的智适应学习生态系统。其中颠覆传统的旗舰之作——智能老师S211白鹭,采用了独特的数字纸张技术,提供原彩、彩墨、水墨三种显示模式,配合高清摄像头,可实时捕捉学习细节。在用户体验和健康关怀上,都在行业内设立了全新标杆。智适应多模态智适应大模型LAM
那么,松鼠Ai提出的这个智适应多模态大模型——LAM,其背后的运作机制是怎样的?具体来说,模型架构一共包含了三大关键组件:知识图谱、推荐系统,和检索增强生成(RAG)。推荐系统中有不同的规划和智能体,包括短期路径规划、长期路径规划。其他组件还有,情感解析、路径追溯(不同的学生都有自己的学习路径)、大模型反馈和总结。此外,AI系统还包含了家长目标、学生画像两个重要的部分。在智能体架构中,整个智能体被称为「智适应智能体」。该体系下面包含了不同的智能体,比如数据分析智能体、自动教学智能体(teaching autonomous driving agent)、教学问答智能体、推理智能体、阅读综合理解智能体等等。不仅如此,针对不同学科,还有不同学科的智能体,比如物理、英语、科学等。这么多智能体,并得是独立的存在,而是通过协作,与学生互动,为其提供个性化学习内容的推荐。为了让多智能体有效协作,研究团队还为此提供了环境支持。当AI系统为不同学生设定目标后,并非是一个「死目标」。它会根据们的学习速度、进度,以及数据分析,动态调整目标,为其做出更合理的推荐。此外,错误分析本体,针对学生犯错,能够提供有针对性的分析。这里,AI系统会记录下所有学生的学习资料,并对其进行评估。学生与AI交互过程中,实时数据便会反馈到智适应引擎中,然后交由AI计算分析。最后,AI系统根据学生下一步学习内容,给出新的推荐,可能是知识,也可能是能力MCM,还有可能是一些实践。除了以上提到的架构,松鼠Ai的引擎中,还融入了其他一些非常重要的技术。全世界的国家中,每个年级每个学科都有不同的学习目标。松鼠Ai研究团队所做的,便是将这些学习目标,分解成更加细致精确的层面,以便算法构建。举个例子,一个关于「分数加法和减法」的目标,可以被分解为第二层(分数的加法、分数的减法、简单分数计算、多步分数计算等的学习目标)。从第二层,还可以分解出第三层更加精细的学习目标,如下图所示。最终,一个学习目标,能够到达的最底层是「第九层」。它可能会根据学生在10个小时学习内容,预测将要完成100个学习目标。另外,还有一个推荐引擎,如上所述,在智能体第一层中,目标会动态改变。以最高十年级,最低七年级为例,由下而上,绿色线是指学生已掌握的学习目标、知识、能力。假设一个学生正在上十年级,遇到了一些无法理解的知识。这时,AI系统就会根据题目追根溯源,建议学生重新温习七年级学习课程。在确保他掌握绊住脚的学习目标后,AI才会继续推进学习进程。再来看一个例子,有三个学生对于学习目标的掌握情况,均是80%。可以看到,每个同学掌握程度虽相同,但另外20%粉红色知识点掌握分布有所不同。这说明了,尽管他们达到了相似的掌握水平,却有着各自的优点和弱点。此外,智适应大模型还包含了MCM系统,它代表了思考方式、能力、方法论。为什么学生需要接受MCM训练?这是因为,不同的行业、不同的职业,需要不同的MCM。可以从不同学科来看,语言、物理、数学等,它们对学生所具备的能力素养,有着不同的要求。经过详细的剖解,可以看出,松鼠Ai的多模态智适应大模型LAM与LLM有着很大的不同。当我们使用ChatGPT等模型时,通过提问得到回答,还有历史纪录。而当你下一次进入这个平台时,它不会给出推荐,并且不会理解个人之前的学习行为,以及整体掌握知识的程度。它不仅有学习者的历史记录,不同的学习行为,还能为学生推荐下一步应该学习的内容。并且,它还会提供非常详细的成绩单和数据,为未来学习规划提供建议。模型持续迭代升级
在多模态智适应大模型中,松鼠Ai研发团队在这次KDD大会上,提出了全新算法——时间序列分析。在题为《Foundation Models for Time Series Analysis: A Tutorial and Survey》论文中,他们系统性地探讨了大模型在时间序列分析中的应用。论文地址:https://arxiv.org/pdf/2403.14735具体来说,论文分析了大模型在教育的应用,包括在教育时序数据分析中的应用。时间序列分析在教育场景中的应用日益广泛,例如,通过分析学生的行为数据、测试成绩和学习习惯,可以预测学生的学习进度,优化教学策略。时序Generative AI通过在大规模教育数据集上进行预训练,能够更好地捕捉复杂的时间依赖性和非线性关系,从而在多个教育场景中实现最优的预测和分类效果。文章也提供了多种未来可能的研究方向,例如结合多模态数据(如文本、图像、语音)进一步提升模型的泛化能力,以及如何通过自监督学习技术减少对标注数据的依赖。这些研究不仅有助于提升时间序列分析的准确性和效率,还为个性化教育和智适应教育提供了坚实的技术基础。松鼠Ai能在本次KDD大会上与世界各地的顶尖学者你来我往,可以体现出松鼠Ai在商业之外所拥有的包括学术、科研等综合硬实力。同时,我们也期待在AI时代全面来临的当下,可以看到更多中国企业出现在这样的顶级峰会上。
「从我手里经过的学生成千上万,奇怪的是,留给我印象最深的并不是无可挑剔的模范生,而是别具特点、与众不同的孩子。」在AI落地教育的种种场景里,我们可以惊喜地发现,「每个孩子人手一个导师」的理想设定,已经无比接近现实。AI老师给予孩子们的,不是一些零碎知识,而是几把钥匙。到那时,每个学生在毕业时,带走的不仅仅我一些知识和技能,而是带走渴求知识的火花,并使它终生不熄地燃烧下去。公众号后台回复“数据集”获取100+深度学习各方向资源整理
点击阅读原文进入CV社区
收获更多技术干货