学习分析的研究目标和对象
《课程教材教学研究》官方投稿邮箱:kechenggw@163.com
学习分析的研究目标和对象摘要:学习分析研究遇到的挑战包括教育数据预处理难度大、数据访问权限不明确、学习分析适用性有限。虽然学习分析尚处于发展初期,但由于能够为教育系统各级决策提供科学参考,已经成为教育...
学习分析的研究目标和对象摘要:学习分析研究遇到的挑战包括教育数据预处理难度大、数据访问权限不明确、学习分析适用性有限。虽然学习分析尚处于发展初期,但由于能够为教育系统各级决策提供科学参考,已经成为教育信息化的重要内容之一。关键词:学习分析;教育数据挖掘;社会网络分析;信息可视化1、研究目标佛罗里达州立大学信息技术领导学院院长、执行董事梅(May}2011)较早提出学习分析的研究目标包括描述性和预测性两大类。德国亚深大学的沙提(Chattietal.}2011)在此基础上,基于具体分析过程将研究目标细分。然而沙提的分类存在一定的内容交叉,例如,“预测和干预”同时需要对学习者的知识结构或学习行为开展“监测和分析”。因此,宾科夫斯基(Bienkowskietal.}2012)从学习分析需实现的功能模块角度提出新观点,其分类涵盖了教育数据挖掘和学习分析两大领域,如“领域知识建模”隶属教育数据挖掘领域,并非学习分析的关注重点。然而,该分类体系粒度划分不均衡。例如,学习者情绪、学习行为范式、学习者当前状态等都是通过观测外显学习行为表达的,导致过半数文献均可归结于“学习者行为建模”子类,粒度划分过于粗犷。此外‘趋势分析’“学习者体验建模”等分类太过模糊,导致部分文献可同时隶属多个类别。李艳燕等(2012)的观点也存在类似情况。上述四位学者的观点及观点之间的对应关系如表一所示。本文借鉴上述学者观点,对269篇文献重新梳理,归纳出学习分析的研究目标主要包括:(一)学习者知识建模为了描述学习者知识和技能的掌握情况,研究者从课程、知识单元和知识点等多个层面,抽取在线学习系统中学习者的交互数据,构建学习者知识模型。该模型主要应用于自适应学习系统和智能教学系统等,体现了学习者过程性知识和高阶思维能力,便于系统在恰当时间采用恰当的学习方式推送恰当的学习内容。例如,弗格森(Fergusonetal.}2013基于线索词匹配和k一近邻聚类技术,利用语篇特征和局部特征相结合的方式,构建学习者知识模型。(二)学习情绪建模为检测学习者无聊、沮丧、兴奋等不同情感状态对学习积极性和学习进展的影响,研究者利用心脏速率监视器、视觉跟踪器等多种可穿戴技术,收集和分析学习者心跳速率、微笑次数、专注时间等身体活动数据,掌握学习情绪对学习成绩的影响。例如,瓦特拉普(Vatrapuetal.}2013)通过技能测量、微笑等九个指标描述学习者学习状态。视觉追踪研究表明,较高的情绪容易促进学习者学习积极性。(三)学习行为特征抽取为研究不同学习行为范式和学习成绩之间的关系,研究者收集在线学习系统的网页点击次数、点击顺序、停留时间等信息,抽取学习行为范式或形成的网络结构特征,并研究其与成绩之间的联系。例如,加拿大萨斯卡通大学(UniversityofSaskatoon)布鲁克斯(Brooksetal.}2014)获取在线学习系统中学习者交互数据,采用非监督机器学习技术,抽取五种学习者行为范式,包括活跃型、早期型、及时型、最少活动型和延期型,指出活跃型对提高学习成绩并无显著性影响。吴怀等(2014)对学习者图示化学习过程开展序列分析,发现具有“概念建构一假设提出一推理论证”学习行为模式的学习者比较容易取得好成绩。(四)学习活动跟踪为了展示学习者当前学习状态,研究者收集在线作业完成情况、教学视频学习时长、在线测评得分、论坛参与等信息,以可视化形式呈现知识建构过程和个人在小组学习中的贡献情况,有助于学习者调整学习计划和学习进展。例如,有学者针对可汗学院在线学习平台大量学习活动数据,基于分类器将全体学习者的学习状态进行等级划分,然后利用个体可视化工具查看个体相对于班级平均学习状态所处的位置(Ruiperez一Valienteetal.,2014)。(五)学习者建模为聚类学习特征相似的学习者,有研究者通过分析个人基本信息及相关数据,例如人口统计、学习风格和学习偏好、学习目标、学习背景等数据,构建描述个人学习特性的学习者模型,并运用该模型将学习者分组,提供有针对性的个性化学习环境,从而提高学习效率。例如,希腊开放大学针对在线论坛中学习者的讨论内容,利用文本挖掘和社会网络分析技术探索学习者的参与模式,并使用统计软件R和数据挖掘工具Weka将学习者按照特征分类(Lot-sari}2014)。北京师范大学武法提等(2014)分析电子书包中电子学档系统记录的数据,从学习内容、学习活动、学习方式和学习评价四个方面构建学习者个性化模型。(六)学位获取分析为探究学习群体信息与学位获取之间的关系,即学习者保持率或毕业率,研究者通过采集入学信息、生源信息、完成情况、学位信息等数据,从课程、学校和政府三个层面探索其中蕴含的序列模式或规律。例如,美国纽约州立大学谢伊等选取弗吉尼亚州和华盛顿州的入学信息和最终学位获取数据,发现参与远程教育课程的学习者比接受传统课程的学习者更易获得学位(Shea&Bidjerano}2014)o(七)教学资源和教学策略优化为帮助教师完善在线课程,研究者通过收集在线学习系统中的学习行为和成绩,评估课程设计效果,找出能够有效促进学习的教学实践类型。例如,列文(Leeuwen}2014)提出基于人工智能框架,从有效性、可用性和效率三方面评估教学大纲质量。北京师范大学沈欣忆等(2014)通过分析MOOCs学习的不足,提出十二种网络课程教学策略,以提高在线学习参与度。(八)自适应学习系统和个性化学习为实现网络环境下学习行为的自动化反馈,研究者综合运用学习者知识模型等,获取学习偏好、学习效果等信息,结合预定义的教学策略和学习路径,为学习者提供个性化学习建议,从而调整和改善学习体验。例如,德国杜伊斯堡一埃森大学(Universi-tyofDuisburg一Essen)哈金(Hecking}2014)在学习管理系统中通过增加操作日志服务、通知代理、分析服务和人工制品检索服务四大服务组件,实现基于上下文的学习内容个性化推荐。深圳大学曹晓明等(2014)提出使用智能Agent技术构建“一对一”的泛在自主学习系统。(九)在线学习影响因素分析由于各级教育机构问责制的加强,教育机构需要解释在线学习过程和学习效果,部分学者以调查问卷的形式分析在线学习影响因素。例如,加拿大西蒙弗雷泽大学阿里等(Alietal.}2013)指出在线学习工具的易用性和实用性将影响在线学习效果。中山大学舒忠梅(2014)指出多元能力的培养氛围、学习资源丰富程度、教师授课水平及相关系统支撑度是在线学习满意度的关键影响因素。按研究目标聚类的学习分析文献年度分布如图3所示。其中,以教学资源和教学策略优化、学习活动跟踪为研究主题的文献分别占23.7%和23.4%成为学习分析的主要研究内容。这与大多数研究者基于微观层面开展学习分析相吻合。2012年以来,学习行为特征抽取、学习情绪建模、在线学习影响因素分析逐渐成为热门主题。而自适应学习系统和个}h}化学习过多强调学习软件的自动反馈机制,更适于教育数据挖掘,因此近三年来相关文献数量呈下降趋势。随着学习分析应用的推广,其研究主题日益趋向多角度、多样化,例如学习者动机建模、大数据访问中正常访问行为的变化情况均成为新的研究内容。可见,在各类学习数据日益丰富的时代背景下,学习分析对教育信息化发展将起到更为突出的推动作用。2、研究对象研究对象的选取将直接影响学习分析的有效J险和预测准确率。贝克(Baker}2011)指出数据的层次性是学习分析数据的重要特征,包括按键层次、答案层次、会话层次、学生层次、课堂层次、教师层次和办学层次,每一层次都嵌套在上一层次中。布朗(Brown}2012)基于数据的内容表征差异,将学习分析研究对象划分为个性特征指标(dispositionalindi-cators)和行为表现指标(activityandperformancein-dicators)。个性特征指标一般是可量化的事实性数据,如年龄、性别、种族、平均分、学习经验等;行为表现指标主要反映在线学习环境中的学习行为数字轨迹,如登陆学习管理系统的次数、在学习网站的时间、发帖次数、测验分数等。顾小清等(2012)认为包括学习者数据和学习过程相关数据两大类。前者指在移动终端、社会性交互软件和学习管理系统中记录的数据;后者包括与学习过程相关的课程、学期考试信息。本文基于数据来源环境差异,认为学习分析研究对象主要包括来自集中式学习环境、分布式学习环境和可穿戴传感器的数据,文献年度分布如图4所示。其中,集中式学习环境的数据分析占主导地位,达41.6%。该数据主要来自学生信息系统、学习管理系统、网络课程等正式学习环境。例如,Moodle中积累的大量学习资料访问和上传行为,及写作、考试等学习活动日志。分布式学习环境的数据分析从2012年开始猛增,逐渐成为新的热点,占27.5%。该数据包括来自各社交网络软件、个人学习环境等非正式学习环境的数据。这些数据往往表现为不同存储格式,分布于多个媒体和网站,例如,利用电子邮件、短信和社交网络开展的学习讨论和交互行为。随着可穿戴传感器的推广,移动数据、生物特征数据和情绪数据等身体活动数据开始引起研究者的关注(SanPedroetal.}2013)。学习者学习活动过程中的实时物理交互活动数据或将成为扩展学习分析渠道和深化学习分析内涵的重要途径,这也为研究者近年开展学习情绪建模提供了数据基础,例如问卷调查数据、年度数据报表等其他来源数据一直是学习分析的研究对象。