教育大数据的实际应用及部分数据处理过程
(1)MOOC 的蓬勃发展。 MOOC 是 Massive(大规模的)、Open(开放的)、
Online(在线的)、Course(课程)四个英文单词的首字缩写,意为大规模网络开
放课程。 2006 年,萨尔曼 ·可汗( SalmanKhan)创办了利用在线视频进行免费授
课的可汗学院,现有关于数学、历史、金融、物理、化学、生物、天文学等科目
的 3400 多段视频,注册用户超过了 1000 万人。 2011 年,斯坦福大学的一门人
工智能网上课程吸引了 190 多个国家的 16 万名学生参加学习,该课程的讲授者
塞巴斯蒂安 ·特伦(Sebastian Thrun)教授创办了在线教育网站 Udacity。2012 年,
盈利性在线大学教育平台 Coursera 上线,和普林斯顿大学、斯坦福大学、密歇
根大学和宾夕法尼亚大学等 83 所大学协同提供课程,目前在全球拥有 380 万的
注册用户。 同年,哈佛大学与麻省理工学院宣布结成非营利性合作伙伴关系, 联
合发起了名为 “edX”的网上课程系统,联手提供免费的在线课程,搭建共同教育
平台,包括清华大学、北京大学在内的其他 26 所全球名校也相继加入了这一平
台。互联网技术的发展带动了教育的网络化和国际化, MOOC 更将传统的远程
教育推向了新的高度和广度, 催动了网络学习时代的到来。 在教育活动中, 相对
于通过师生面对面的接触获取教育数据的途径而言, 基于大型网络课程平台进行
数据挖掘的方式显然有效得多: 学习行为的数据将自动留存, 更易于后期的学习
行为评价和评估;教师只需通过分析整合学习行为就能得到学习过程中的规律;
利用数据挖掘的关联分析和演变分析等功能, 在学生管理数据库中挖掘有价值的
数据,分析学生的日常行为, 可得知各种行为活动之间的内在联系, 并提出相应
的对策。
(2)个性化课程分析。佛罗里达州立大学利用 eAdvisor 程序为学生推荐课
程和跟踪其课业表现。奥斯汀佩伊州立大学的 “学位罗盘( Degree Compass)”系
统在学生注册课程前, 通过机器人顾问评估个人情况, 并向其推荐他们可能取得
优秀学业表现的课程。系统首先获取某个学生以前(高中或大学)的学业表现,
然后从已毕业学生的成绩库中找到与之成绩相似的学生, 分析以前的成绩和待选
课程表现之间的相关性、 结合某专业的要求和学生能够完成的课程进行分析、 利
用这些信息预测学生未来在课程中可能取得的成绩, 最后综合考量预测的学生成
绩和各门课程的重要性,为学生推荐一个专业课程的清单。