交互式监督学习工作坊：使用Python构建预测模型

需积分: 14 16 浏览量更新于2024-11-22 收藏 55.81MB ZIP 举报

资源摘要信息:"The-Supervised-Learning-Workshop:一种理解监督学习算法的交互式方法" 1. 监督学习概念监督学习是机器学习领域中的一种学习范式，它涉及到使用标记的训练数据集来训练一个模型，使得模型能够预测未标记数据的输出。在监督学习中，输入数据与相应的输出数据（通常是标签或者结果）一同提供给模型。模型的目标是学习如何将输入映射到正确的输出。 2. Jupyter Notebook的安装和使用 Jupyter Notebook是一个开源的Web应用程序，允许用户创建和共享包含实时代码、方程式、可视化和解释性文本的文档。要开始使用Jupyter Notebook，需要在计算机上进行安装。这通常通过安装Anaconda来实现，因为Anaconda的安装包中已经包含了Jupyter Notebook。 3. Anaconda的安装 Anaconda是一个用于科学计算的Python发行版，它包含了conda、Python等180多个科学包及其依赖项。Anaconda通过管理工具conda，帮助用户方便地安装、运行和升级这些包和它们的依赖项。安装Anaconda后，用户可以使用conda来安装和管理Jupyter Notebook及其他科学计算相关的软件包。 4. NumPy和Pandas库的导入与数据评估 NumPy是Python编程语言的一个库，提供了高性能的多维数组对象和这些数组的操作工具。Pandas是一个强大的Python数据分析库，提供了高性能、易于使用的数据结构和数据分析工具。在Jupyter Notebook中，可以通过导入NumPy和Pandas库来处理和分析数据集。 5. 探索性数据分析（EDA）探索性数据分析是数据挖掘中的一个过程，目的在于发现数据集中的模式、异常值、数据趋势等。通过EDA，可以更好地理解数据的分布、关系和特征，为后续的数据处理和模型构建打下基础。 6. 数据集的摘要统计信息摘要统计信息通常包括数据集的均值、中位数、标准差、四分位数等，能够提供数据的概览。使用Pandas库可以方便地获取这些统计信息，进一步了解数据集的中心趋势和分布情况。 7. 线性回归分析线性回归是监督学习中的一种基本算法，用于预测连续值的输出。在监督学习工作坊中，参与者将学习如何使用线性回归来提高模型的性能。 8. 决策树与k最近邻居（KNN）模型决策树是一种常用的分类方法，它通过一系列的规则对数据进行分类。KNN是一种基于实例的学习方法，通过查询最接近的K个邻居的数据点来进行预测。在本工作坊中，参与者将通过实现KNN模型来提高预测的准确性。 9. 绘制精确调用和ROC曲线精确调用（Precision-Recall curve）和ROC曲线（Receiver Operating Characteristic curve）是评估分类模型性能的两种重要工具。精确调用曲线关注的是正样本被预测为正的准确性，而ROC曲线则是通过调整分类阈值来平衡真正率（True Positive Rate）和假正率（False Positive Rate）。参与者将学习如何在Jupyter Notebook中使用matplotlib库来绘制这些曲线，从而对模型进行性能评估。 10. Python编程语言在机器学习中的应用 Python是机器学习领域中广泛使用的编程语言之一，它拥有众多的库和框架，如NumPy、Pandas、Scikit-learn等，这些都是进行数据处理和机器学习任务的利器。在监督学习工作坊中，参与者将主要使用Python来进行各种数据分析和模型构建的任务。 11. 相关工作坊资源推荐提供链接的工作坊可能包含了其他与监督学习相关的内容，例如无监督学习工作坊，这通常涵盖聚类、关联规则学习等其他类型的机器学习方法。这些工作坊为想要深入了解不同机器学习方法的学习者提供了更多的学习资源。以上内容是基于给出的文件信息中所涉及的标题、描述、标签和压缩包子文件的文件名称列表，整理出来的关于监督学习工作坊的知识点。希望这些信息对您理解和应用监督学习算法有所裨益。

收起资源包目录

The-Supervised-Learning-Workshop:一种理解监督学习算法的交互式方法（586个子文件）

boston_house_prices_regression.csv 12KB

Exercise5.09.ipynb 21KB

Exercise6.02.ipynb 11KB

t10k-images-idx3-ubyte.gz 1.57MB

breast-cancer-data.csv 122KB

Exercise5.04.ipynb 63KB

Exercise_4_01.ipynb 406KB

Exercise6.06.ipynb 59KB

Activity5.02.ipynb 19KB

Activity_3_04.ipynb 79KB

Exercise_1_04.ipynb 11KB

Activity 15 - Breast Cancer Diagnosis Classification using Artificial Neural Networks.ipynb 5KB

Exercise_3_01.ipynb 178KB

Activity 12 - Breast Cancer Diagnosis Classification using Logstic Regression.ipynb 5KB

Exercise5.02.ipynb 29KB

Exercise6.03.ipynb 13KB

Activity 14 - Binary Classification Using a CART Decision Tree.ipynb 5KB

train-images-idx3-ubyte.gz 9.45MB

t10k-labels-idx1-ubyte.gz 4KB

Activity_3_03.ipynb 143KB

Exercise_2_11.ipynb 13KB

Activity_2_03.ipynb 618KB

house_prices.csv 450KB

breast-cancer-data.csv 122KB

Exercise_3_04.ipynb 63KB

Exercise_2_14.ipynb 235KB

Activity_2_01.ipynb 216KB

Exercise_2_05.ipynb 8KB

Exercise7.03.ipynb 7KB

Exercise7.05.ipynb 19KB

Activity7.01.ipynb 38KB

Activity_3_05.ipynb 76KB

t10k-labels-idx1-ubyte.gz 4KB

Exercise5.05.ipynb 47KB

Exercise7.01.ipynb 8KB

Exercise6.04.ipynb 50KB

Exercise_1_05.ipynb 16KB

final_predictions.csv 228B

Exercise_2_12.ipynb 29KB

desktop.ini 64B

train-labels-idx1-ubyte.gz 28KB

Exercise6.05.ipynb 51KB

Exercise_1_01.ipynb 9KB

boston_house_prices.csv 38KB

train-labels-idx1-ubyte.gz 28KB

Exercise_1_02.ipynb 17KB

Exercise_2_09.ipynb 59KB

Exercise5.01.ipynb 65KB

linear_classifier.csv 161B

austin_weather.csv 103KB

Exercise_2_06.ipynb 18KB

Exercise_3_06.ipynb 64KB

earthquake_data.csv 676KB

titanic_regression.csv 13KB

Exercise6.01.ipynb 8KB

synth_temp.csv 30KB

Exercise_2_13.ipynb 157KB

Activity 13 - KNN Multiclass Classifier.ipynb 4KB

t10k-images-idx3-ubyte.gz 1.57MB

Activity6.01.ipynb 28KB

titanic.csv 91KB

Exercise_2_08.ipynb 10KB

titanic.csv 91KB

spx.csv 140KB

Exercise5.07.ipynb 24KB

Exercise5.08.ipynb 51KB

Activity_3_01.ipynb 67KB

train-images-idx3-ubyte.gz 9.45MB

Exercise_2_02.ipynb 342KB

boston_house_prices_regression.csv 12KB

Exercise_2_04.ipynb 4KB

Exercise_2_16.ipynb 34KB

Exercise_3_03.ipynb 141KB

Exercise_2_15.ipynb 22KB

Activity_3_02.ipynb 130KB

Activity5.04.ipynb 23KB

Exercise_2_07.ipynb 10KB

Activity5.01.ipynb 27KB

Exercise7.04.ipynb 13KB

austin_weather.csv 103KB

titanic.csv 61KB

titanic_classification.csv 25KB

combined_cycle_power_plant.csv 301KB

Activity_2_02.ipynb 99KB

Exercise_3_07.ipynb 681KB

Activity5.03.ipynb 28KB

Exercise5.06.ipynb 129KB

Exercise_3_05.ipynb 96KB

Activity 11 - OLS Classifier - Binary Classifier.ipynb 4KB

Exercise_2_03.ipynb 4KB

Activity_1_01.ipynb 31KB

.gitignore 599B

Exercise7.02.ipynb 7KB

Activity_4_01.ipynb 655KB

Exercise_1_03.ipynb 27KB

Exercise5.03.ipynb 20KB

Exercise_2_01.ipynb 32KB

Exercise_2_17.ipynb 30KB

Exercise_3_02.ipynb 63KB

Exercise_2_10.ipynb 34KB

共 586 条

仰光的瑞哥

粉丝: 19
资源: 4623

交互式监督学习工作坊：使用Python构建预测模型

Graph-Based Semi-Supervised Learning

SSFL-Benchmarking-Semi-supervised-Federated-Learning:对标半监督联合学习

Self-Supervised_Learning_Papers-Code:自我监督学习论文

Semi-Supervised-Learning-Image-Classification:该库包含使用TensorFlow 2.x和Python 3.x实现的计算机视觉任务的半监督学习算法

Scaled-down-self-supervised-learning:自我约束学习的正式pytorch实施

Prediction-Using-Supervised-Machine-Learning-:紧握

Self-Supervised-Learning-for-Fine-grained:应用自我监督学习进行细粒度图像分类

单层感知器神经网络matlab代码-homemade-machine-learning-cn:流行的机器学习算法的Python示例，交互式Ju

clinical-grade-computational-pathology-using-weakly-supervised-deep-learning-on-whole-slide-images:首个临床等级的AI系统可用

Semi-Supervised-Learning-To-Improve-Lung-Cancer-Detection:使用生成模型和半监督学习促进肺癌检测

最新资源