1.简介
人工智能在当今迅猛的发展,各行各业都在迅速向人工智能靠拢,谷歌的
‘AlphaGo‘,无人驾驶技术以及小米的智能家居等等,都向我们证明了未来是属于
人工智能的。2018 年的谷歌开发者大会也向人们展示了谷歌未来的人工智能研
究方向。然而机器学习是目前最接近人工智能的系统,如果在没有机器学习的情
况下创建人工智能,那么这个过程将会是复杂耗时的。所以机器学习是人工智能
的基础。如今机器学习的应用更是家常便饭,例如垃圾邮件的分类,图像识别技
术,某商品的销售趋势预测等等数不胜数。可以说机器学习无处不在,然而机器
学习必须建立在对大量数据的分析之上,通过对已有数据的分析和处理加之学习
之后就能对新的数据作出相对正确的预测。
如今在有了学生智能卡系统和教务处系统的条件下,大量的学生数据可以被
收集起来,研究者们认为这些数据可以反映学生学习的努力程度(Campbell,
DeBlois, & Oblinger, 2007)和学生的学习成绩(Macfadyen & Dawson, 2012; Yin et
al.,2015)。
为了降低大学生的挂科率和留级率,许多学者利用学生在校表现等方面的数
据来识别他们是否有学业预警的危险。他们认为可以成功预测学生在一门课程上
的最终成绩(Lackey, Lackey, Grady, & Davis, 2003; Olani, 2009; Jin, Imbrie, Lin, &
Chen, 2011)。预警模型可以提前提醒那些濒临挂科的学生来降低学校留级率。
但是上述研究中存在普遍的问题就是预警模型只针对单独的一门课程而不是对
所有的选修课程进行综合分析。另一个问题就是之前许多研究都是为网上课程设
计的,现在缺乏对传统课程的合适研究模型.
所以在这篇论文中,预警模型是针对在校大学生的传统课程(非线上授
课),找到学业落后的学生。使用中国海洋大学 2013 级本科生的数据,经处理
后得到样本集,样本分为落后生和普通生两类,将其转变为二分类问题,(分类
标准参见之后)对多种算法运用交叉检验,针对落后生寻找符合要求的模型,然
后展示了实验结果,并进行分析,最后对模型进行一定的改进。