"百面机器学习训练营第三期作业笔记整理：特征工程和非监督学习"

需积分: 0 135 浏览量更新于2024-01-14 收藏 721KB PDF 举报

本次任务的主题是机器学习的非监督学习方法以及特征工程和模型评估。在日常数据的训练中，通常会缺乏标注好的数据，这就需要使用非监督学习的方法来处理没有标签信息的输入数据。非监督学习是机器学习的一种方法，其目标是在没有标签信息的情况下对数据进行建模和拟合。与监督学习不同，非监督学习的目标并不是预测或分类，而是通过发现数据中的结构和模式来提取有用的信息。在非监督学习中，常用的方法有聚类、降维和异常检测等。聚类是将数据分成不同的组或簇，使得组内的数据点相似度较高，而组间的数据点相似度较低。常见的聚类算法有K-means、DBSCAN等。降维是将高维数据映射到低维空间，以减少特征的维度，同时保留数据的关键信息。常见的降维方法有主成分分析（PCA）和线性判别分析（LDA）等。异常检测是识别数据中与大多数样本显著不同的观测点。异常检测可以应用于识别网络入侵、金融欺诈检测等领域。另外，特征工程也是机器学习训练中重要的一环。特征工程是指通过对原始数据进行预处理和转换，构建出更适合用于机器学习模型训练的特征表示。常见的特征工程操作包括缺失值处理、数据标准化、特征选择、特征编码等。模型评估是判断机器学习模型性能好坏的关键环节。常用的模型评估指标包括准确率、精确率、召回率、F1值和AUC等。其中准确率衡量了模型预测结果的正确性，精确率和召回率衡量了模型在正例预测和负例预测上的性能，F1值综合了精确率和召回率，而AUC则衡量了模型在不同阈值下的分类性能。在完成本次任务时，建议学习者具备一定的高等数学、概率论和线性代数基础知识。此外，熟悉基础的机器学习算法也是必要的，可以参考《西瓜书》等经典教材进行复习。通过学习本次任务，学习者将深入了解非监督学习方法在机器学习中的应用，学习如何进行特征工程以及如何评估机器学习模型。这些内容将为学习者提供一定的机器学习基础，帮助他们更好地理解和应用机器学习技术。同时，通过完成相关的编程作业，学习者还可以巩固理论知识，并提升自己的实践能力和编程能力。总之，本次任务涵盖了机器学习中非监督学习方法、特征工程和模型评估等关键内容，通过学习和完成相关的作业，可以帮助学习者建立起扎实的机器学习基础，为进一步深入研究和应用机器学习奠定坚实的基础。

任务简介：学习《百面机器学习》3.2-3.3

详细说明：

由于支持向量机部分较难，我们先行学习后面两章。逻辑回归、决策树这两

种经典分类算法。在很多实际问题中，因为海量且带有精确标注的数据难以获得，

深度学习没有大显身手的余地，许多传统方法可以灵活巧妙地进行处理。

我们为大家准备了逻辑回归和决策树的讲解视频和算法代码实战，视频和书本搭

配可以更好的理解知识点，大家可以边看讲解文档，边运行程序代码，以期能够

更好的理解这两个算法。

学习视频：

逻辑回归

决策树

实战代码：

链接：https://pan.baidu.com/s/1wa73n4LshEiylpRHViUMbA

密码：bbwl

在同学们完成了第一部分的代码实战后，我们准备了一个达观杯的文本智能

处理挑战赛，并且使用逻辑回归进行分类，很简单的一个版本，让大家体验一下

比赛的感觉，具体的可以打开下面的链接，下载相应的文档，进行学习。

链接：https://pan.baidu.com/s/1MUAydLfqEgqpOtUkH4iiHQ

密码：noqn

打卡要求：描述两类算法的应用场景、优势和区别

打卡内容：不少于 100 字描述

打卡截止日期：8/23

1.4 本周学习内容总结

任务简介：第一周 LeetCode 作业

详细说明：请一定在今天完成本周 LeetCode 全部题目

打卡要求：请用文字描述，本周所学知识的重点，格式不限，思维导图、手写、

剩余19页未读，继续阅读

葡萄的眼泪

粉丝: 21

"百面机器学习训练营第三期作业笔记整理：特征工程和非监督学习"

2020华为云实战营第三章课程五分钟快速打卡作业打卡.zip

数据-行业数据-第五期TK训练营群群聊精华_2020 (19).rar

第十二章-SVM支持向量机 深度之眼_吴恩达机器学习作业训练营

机器学习python大作业

作为Python初学者，我应该如何结合Andraw Ng的机器学习课程和《Python零基础学习者大作业强化训练》来完成我的第一个机器学习项目？请提供详细的步骤和要点。

结合Andrew Ng的机器学习课程与《Python零基础学习者大作业强化训练》，如何从零开始规划并实施一个完整的机器学习项目？

matlab机器学习训练围棋

机器学习训练样本实例

北邮+机器学习+自动化+yhh+机器学习实验+作业+kmeans算法1

如何利用Andraw Ng的机器学习课程和《Python零基础学习者大作业强化训练》资源，从零开始进行一个机器学习项目？请提供一个详细的步骤指导。

最新资源

第十二章-SVM支持向量机深度之眼_吴恩达机器学习作业训练营