基于特征挖掘与文本分析的硕士论文质量评估与竞赛论文优劣分析

版权申诉
0 下载量 190 浏览量 更新于2024-06-16 收藏 3.01MB PDF 举报
全国大学生数据统计与分析竞赛21年的A题关注的是数据分析与评估在研究生教育中的应用。参赛者针对硕士学位论文的质量评估提出了一个综合的方法。论文主要涉及以下几个关键知识点: 1. 特征挖掘与文本分析:研究者运用特征挖掘技术对硕士学位论文进行深入剖析,以提取论文的关键特征。同时,通过文本分析,尤其是评语部分,来理解专家对论文质量的主观评价。 2. 论文淘汰机制:采用了“末位5%淘汰制”,通过学科门类内的排名,对论文质量进行排序并剔除表现最差的5%论文,确保评选的公正性。 3. 一致性与差异性分析:通过计算论文总分和单项分数的平均值,以及与专家评分的比较,采用正态分布检验和Pearson/Spearman相关系数等方法,评估评分标准的一致性和差异性,以确定学科门类间水平。 4. 专家观点评价模型:利用TF-IDF和word2vec模型对评语进行关键词抽取和情感分析,以量化评语中关于选题、创新、能力及规范方面的评价,确保评价的客观性。 5. 综合得分计算:论文的综合质量由总分平均分、评论平均得分和所属学科水平共同决定,采用层次分析模型结合AHP和熵权法确定权重,再通过Topsis方法计算出论文的综合得分,以便于公平比较。 6. 典型性区分指标:为了识别工学学科内论文的优劣,研究者选取特定指标对问题论文和优秀论文进行细致的对比分析,揭示两者间的区别。 这个研究不仅提升了论文质量评估的科学性和精确性,也为其他研究生教育机构提供了一套可能的评价框架,对于提升学术研究水平具有实际意义。