大数据视角下的个性化教育探索
0 引 言
如果说互联网和移动互联网技术促进了教育的全球化、民主化和多元化,那么大数据技术将实现教育的个性化和定制化,大数据时代个性化教育[1]的研究价值和应用潜力巨大。教育领域积累了具有广泛应用价值的海量数据,教育数据的多样性、关联性、时效性、可追溯性等特点为教育大数据分析提供了绝佳条件。大数据挖掘可以对教育数据进行从微观到宏观的统计、分析、推理和预测,发现学习和教学的相互作用规律和趋势走向,帮助教师和管理者更好地做出学习指导和教育决策,既能为学生提供高质量、个性化的学习体验,又能改进教师的教学方式,完善和优化教学过程。在当今大数据时代,利用数据挖掘、机器学习、深度学习等大数据技术,进行大规模教育?稻菁?的深度挖掘和分析预测,从而指导个性化教育决策,使传统教育从统一化、标准化转向个体关注,能实现真正意义上的个性化教育。
1 大数据时代看个性化教育
1.1 教育大数据成为研究热点
随着教育信息化和教育大数据技术的高速发展,教育的形式、内容、渠道等方面都在加速演化和变革,国内外层出不穷的教育大数据研究与应用就是很好的例证。在国外,以Coursear、TED、Udemy、Udacity、edX、可汗学院等为代表的大型开放式在线课程(MOOC,massive open online courses)的兴起,为教育全球化和大数据驱动的个性化教育提供了新的试验场。麻省理工学院(MIT)于2014年7月发布了名为《麻省理工学院教育之未来》(The Future of MIT Education)的研究报告[2],用模块式课程代替学期制课程,并充分利用大数据技术和edX开放式网络课程进行教育改革。纽约大学创新了教育数据管理体制,设立专门的大数据机构(CDS, The NYU Center for Data Science)进行校级大数据管理分析工作,旨在通过运用大数据技术改善教育,向教师和管理者提供学生到底在“怎样”学习更多、更细、更精确的信息。在国内,近几年大数据研究覆盖了多个学科领域[3],基于大数据的个性化教育研究逐渐成为热点,周进[4]提出了一种过程支持框架,以支持大数据时代的个性化教育。朱天宇、陈恩红等[5]对基于认知诊断的个性化试题推荐方法做了深入研究,为课程、试题等教育资源的科学推荐提供了很好的参考。毕鹤霞[6]对大数据条件下高校贫困生确认模型进行了实证研究。电子科技大学的周涛[7]对数万名学生的生活和学习信息(包括食堂消费、图书借阅、学习成绩等)进行了大数据分析,找出了成绩好和成绩差学生的群体特征,对有心理问题的学生可以进行初步预测和定位,为教师和管理者提供了鲜活的个性化教育决策支持。
1.2 个性化教育将由大数据技术驱动
大数据时代的教育有几个显著特点:一是教育数据的时效性,传统的《百科全书》多年才印刷一次,如有错误需要数年后才能修订,如今的维基百科每分每秒都在进行海量条目数据的更新;二是教育形式和数据的多样性,在线、离线、课上、课下、手机、电脑、平板、图像、文本、视频等层出不穷,随着教育形式、渠道、载体的多样化,教育大数据积累的广度和深度在急剧扩展;三是教育数据的可追溯性,比如一个学生考试得了70分,在传统教育管理模式下这只是一个数字,难以深入挖掘原因,在大数据时代这个数字能变成可追溯评价的信息,这个学生为什么考了70分,而不是50分或90分?跟他的家庭情况、智力水平、学习态度、努力程度等有什么联系?当前成绩对后续课程的学习会造成怎样的影响?上述3个方面对传统教育的内容、方式、评价等都提出了挑战。由于传统教育采用的是大规模、标准化的教育模式,重视结果而忽略过程,只能事后分析而无法提前预测和介入指导。这种教育在一定程度上讲,还是分数教育,很难做到因材施教和个性化。随着教育大数据的积累和数据挖掘、机器学习技术的快速发展,利用大数据对学习行为、学习趋势、学习心理、教学效果等进行深入分析和评价成为可能。已有众多学校、企业和教育管理机构在不断创新、探索和应用教育大数据技术,以期达到个性化教育之目的。同时为基于实证的教育(evidence-based teaching, EBT)[8]目标提供数据支撑,并为教育管理者提供统观全局的决策支持。大数据技术促使教育形式、规模、影响力发生深刻的变化,决定教育未来的将是那些有效利用大数据技术,通过挖掘分析、追溯评价改进并适应个性化教育的组织机构。
2 面向个性化教育的大数据技术初探
2.1 实现个性化教育的关键是学习评价
怎么进行更深入、更专业的学习评价,是实现个性教育的关键环节。面向个性化教育的学习评价技术要考虑教育大数据的多样性、时效性、可追溯性等特点,并根据学生、教师、管理3个维度的评价需求,对教育教学中海量数据进行大数据挖掘分析,结合态度、行为、背景等因素,分析发现学生思想、行为和心态的变化,通过各种数据指标的评价分析为个性化教育提供一手资料。基于大数据的个性化学习评价技术,需重点关注如下几个方面的分析内容。
(1)学习行为:学生学习效果的优劣与其学习行为紧密相连,学生的行为数据包括进出图书馆的次数、借阅书籍的种类、生活记录信息等,计算出每名学生的学习、生活状态。对学生的学习行为进行分析,能为学习预测和学习预警提供更科学的数据支持,例如刻画学生生活与学习的规律性。如果某学生最近几个月作息极不规律,那么他的成绩就会有下滑的可能,或者某学生进出图书馆的频率较高,学习成绩会往好的趋势发展;或者分析所修课程相关性,如先导课程的掌握程度对后续课程的成绩有较大的影响。通过多种学习行为数据的分类、聚类和预测挖掘技术,进行多角度学习预测分析,是学习评价技术要解决的主要问题。 (2)学习趋势:通过数据挖掘分析学习者在学习过程中产生的各种信息数据,进行学习趋势预测和学习效果评价,进一步发现学习规律,从而为优化和完善教学指导提供个性化的数据,为学习者提供个性化的学习指导。例如,根据学生大一课程的学习效果预测后续学习的走向;或未通过某些核心基础课程的学生会有较大概率在专业课学习过程中遇到困难。
(3)学习预警:挖掘学生的学习行为和学习结果(成绩、获奖、重修、延期等情况)历史数据,通过学生用户画像和聚类预测挖掘技术,得出优秀学生和问题学生的群体共性特征。根据设定的特征权重阈值,对后来的学生进行学习预测,对符合差生发展趋势的学生进行预警和指导。通过聚类挖掘技术找出远离群体特征的行为异常学生,这类异常学生可能特别优秀、有异于常人的个性,或有相关心理问题等。结合预测结果的判断,教师进行预警并提前关注指导。
2.2 教育大数据涉及4个层面的共性技术
上述学习评价内容是个性化教育大数据挖掘和分析的重点。要实现个性化教育的大数据分析目标,还需要明确如下问题:针对分析目标,如何进行高校多维数据(学生、教师、管理3个维度)的采集和存储;通过交互式分析技术和数据挖掘建模技术,对教育数据进行多方面探索,如何进行分析结果的展示和互动操作;如何对分析成果进行应用评估和反馈、优化,从而指导个性化教育实践。针对上述问题,一般来讲,教育大数据分析的共性关键技术[9]涉及采集、存储、计算、展示4个层面。
1)数据采集技术。
目前大部分学校基本建立了完善的管理信息系统,积累了大量的数据。除了通过数据库抽取技术采集必要的结构化数据之外,还需考虑通过数据接口或网络爬虫等技术采集各类系统和网络中散布的大量半结构化和非结构化数据。采集过程中,需对数据进行清洗和脱敏,保证数据质量和安全。
2)数据存储技术。
支持海量数据的分布式存储是教育大数据分析的基础。传统关系型数据库的存储访问瓶颈,无法靠自身解决,一般利用HDFS的分布式、高可用数据存储,结合HBase、Hive等NOSQL数据库,解决海量教育数据存储问题。同时,需针对分析目标,进行多维数据的索引和逻辑关系存储设计。
3)数据计算技术。
数据计算是教育大数据和学习评价技术的核心内容。围绕大数据细分目标进行相关技术的选择,主要研究挖掘技术(如预测、聚类、分类)模型和算法。另外,为了提高计算性能和处理能力,可采用Mapreduce离线计算模式进行教育数据处理;或针对需要实时分析场景,采用基于Spark的内存计算模式或Storm流式计算模式,以提高大数据计算性能和响应效率。
4)数据可视化技术。
对教育大数据应用效果来讲,如何对分析结果进行友好的展示和互动决策操作起决定性作用。让高教管理人员和教师快速掌握和理解大数据分析结果,大数据可视化是重要的技术手段,采用控制面板、多维图表等数据可视化技术,可降低大数据应用难度。
3 个性化教育实践:一种基于深度学习技术的多维度学习评价方法
学习评价作为个性化教育的关键内容,面临很多问题,特别是在教育大数据条件下,基于大数据的新学习评价方法应该关注全面性、过程性、预测性等内容,不仅是知识考试层面,还应从能力、水平、趋势等多个维度进行分析,涉及学生的家庭、兴趣、态度、生活等多个非认知领域。由于传统的学习评价一般采用事后性的汇总统计或专家意见评价方式,虽然可操作性强、结果比较客观,但无法及时把握学生的学习趋势及走向,无法全面评价学生的学习过程、进展从而提前干预指导。针对个性化教育需求和传统学习评价存在的问题,笔者提出了一种基于大数据深度学习技术的多维度学习评价方法。
3.1 深度学习与深度信念网络
2006年Geoffrey Hinton首次提出深度信念网络 (Deep Belief Network, DBN)[10],开启了深度学习的研究热潮。深度学习的概念源于人工神经网络的研究,可以说是神经网络的升级版。通过学习一种模拟人脑视觉原理的多层非线性网络结构,实现复杂函数逼近,展现了强大的从训练样本集中学习数据集本质特征的能力。近年来,深度学习的应用范围非常广泛,已经在语音识别、图像识别、信息检索、自然语言处理等领域取得了成功,在传统机器学习如文本挖掘、时序预测、故障诊断、基因分析、教育数据挖掘等领域,深度学习也在加速渗透和应用。深度信念网络DBN是一种经典的深度学习方法,具有较强的从大量样本中提取特征的能力。DBN由多??受限玻尔兹曼机(Restricted Boltzmann Machines, RBM)组合而成,已经成功应用于多个领域的分类预测问题,曾是机器学习研究的热点,但尚未见其应用于教育大数据分析和学习评价预测。鉴于此,结合学习相关特征和学习预测评价原理,笔者首次提出基于DBN的学习预测评价方法。该方法可以利用教育数据中大量无标签样本进行预训练,优化模型参数,结合有标签样本调优,可以获得学习深层次特征,进行学习趋势预测。
3.2 基于深度信念网络的多维度学习评价框架设计
多维学习评价的核心目标是通过大数据挖掘建模和分析,让教师和教育管理者实时了解学生的学习动态、学习水平、发展趋势,并能及时干预指导。同时,通过预测结果的诊断、对比、反馈处理,对学生学习影响因素进行追溯和分析评价。基于深度信念网络进行离线学习评价建模,再通过学习预测,能就规律和预测信息形成个性化教育决策支持,并进行应用和评估。构建的具有反馈优化能力的个性化学习预测评价框架,可对学习水平、趋势、能力等多个维度进行特征挖掘和预测,框架原理见图1。
正确的预测结果提交给教师和管理者进行决策参考,并形成反馈知识和经验数据融入模型;对错误的预测结果进行问题定位,找出相关数据问题或模型参数问题,进行参数调优和模型修正。通过这个迭代、反馈、优化的闭环信息处理过程,逐步提升学习评价模型的稳定性和准确率。 4 结 语
在研究过程中还有一些问题需要解决。受限于现实条件,教育相关数据无法短时间内做全面采集和清洗处理,在分析的数据规模和模型的预测能力方面还需要加强。未来研究计划实现对T级教育大数据进行自动特征挖掘和预测,全方位覆盖个性化教育学习水平、趋势、能力、心理等多个维度的预测评价;收集更全面、更大规模的教育数据,并将其他相关深度学习技术应用于个性化教育大规模数据挖掘。
本文版权归教育教学论坛杂志社及本文作者所有,未经同意,不得转载! ——《教育教学论坛》查稿电话:0311-85178286
- 上一篇:计算机科学精神与青年大学生素质教育研究 2018/2/9
- 下一篇:继续教育的现状与思考 2018/2/9