人工智能基础编程作业：垃圾邮件分类与PCA人脸识别

需积分: 0 50 浏览量更新于2024-08-05 收藏 499KB PDF 举报

"编程作业2-分类+PCA降维1，人工智能基础，机器学习，监督学习，非监督学习，垃圾邮件分类，PCA人脸识别，Python编程，SpamAssassin语料库，特征词类别知识库，词项-文档矩阵(TDM)，分类器训练，测试，评估指标(Precision, Recall)" 实验内容详解：本次编程作业主要涵盖两个部分：垃圾邮件分类（Part1）和PCA人脸识别（未在提供的内容中详述）。这两个任务旨在帮助学生深入理解监督学习和非监督学习的基本概念及其在实际问题中的应用。 1. 垃圾邮件分类 - 数据集：使用的是SpamAssassin语料库，包含了标记为spam（垃圾邮件）和easyham（易识别的正常邮件）的邮件样本。 - 预处理：在处理原始邮件时，需要去除邮件头部，仅保留邮件正文，以便提取有意义的信息用于分类。 - 特征提取：构建特征词类别知识库，这涉及从邮件文本中抽取特征词，形成邮件分类器的特征集。 - 量化特征：构造词项-文档矩阵（TDM），记录每个词项在每个文档中出现的次数。Python中可以使用各种库（如Scikit-learn、NLTK等）来实现这一过程。 - 分类器构建：使用监督学习方法，如朴素贝叶斯、逻辑回归、支持向量机等，训练一个二分类模型以区分垃圾邮件和正常邮件。 - 训练与测试：使用带标签的训练数据训练模型，然后在未见过的测试数据上进行预测，比较预测结果与真实标签，评估模型性能。 - 评估指标：常用的是SP（Precision，精确率）和SR（Recall，召回率）。精确率是分类器预测为垃圾邮件的邮件中真正为垃圾邮件的比例，而召回率是所有实际垃圾邮件中被正确识别的比例。通过这个实验，学生将能够实践特征选择、模型训练以及性能评估等机器学习的关键步骤，加深对监督学习算法的理解，同时提升Python编程技能。实验报告和代码应按指定格式提交，确保包含完整的实验流程和结果分析。

人工智能基础

编程作业 2

http://staff.ustc.edu.cn/~linlixu/ai2018spring/

完成截止时间：2018/7/2

提交至：ustc_ai2018@163.com

助教：赵若宇 [zry1997@mail.ustc.edu.cn]

梁润秋 [815556875@qq.com]

盛鑫 [xins@mail.ustc.edu.cn]

申书恒 [vaip@mail.ustc.edu.cn]

实验说明

目的

本次实验考虑机器学习中传统的监督学习问题与非监督学习，基于两个应用：

垃圾邮件分类和 PCA 人脸识别，并结合课上介绍的相应学习算法，在数据集上

分别进行实验，以加强对相关算法原理及应用的理解。

提交

1. 实验提交邮箱：ustc_ai2018@163.com，主题：学号_姓名_实验二

2. 附件格式为“学号_姓名.(rar|zip)” ，要包括实验报告和实验代码。两

个实验的文件分别放在 part1 和 part2 文件夹中。实验报告可以共用一

份，也可以每个实验用单独的实验看 v 报告。

3. 实验使用 Python 语言

下载后可阅读完整内容，剩余6页未读，立即下载

yiyi分析亲密关系

粉丝: 32
资源: 321

人工智能基础编程作业：垃圾邮件分类与PCA人脸识别

PCA降维算法实践教程与应用分析

PCA降维与K-means聚类：机器学习课程实验python代码解析

掌握scikit-learn非监督学习：聚类与PCA降维实战教程

Python-PCA降维人脸识别，已包含yale数据库

PCA降维+分类器 python语言写的

PCA降维算法实践及应用.zip

机器学习编程作业降维PCA（主成分分析）.7z

Coursera Machine Learning 第八周week8ex7 K-Means Clustering and PCA编程全套满分题目+注释

毕设&课程作业_基于matlab-pca的人脸相似度.zip

PCA大作业.zip

最新资源