人工智能基础实验: LAB2要求1 - 数据处理与模型评估

需积分: 0 0 下载量 40 浏览量 更新于2024-08-05 收藏 1.05MB PDF 举报
本篇文档是关于人工智能基础LAB2的实验要求,主要涵盖以下几个关键知识点: 1. **PyTorch环境设置**: 实验要求使用Python版本3.6以及Anaconda来创建一个开发环境,具体依赖包包括PyTorch 1.8.1和torchvision 0.9.1。学生需确保在本地或Google Colab的CPU或GPU环境中安装这些库,并通过链接<https://pytorch.org>和<https://pytorch123.com>获取最新版本。 2. **数据集准备**: 使用`http://archive.ics.uci.edu/ml/datasets/Abalone`数据集进行实验,数据包含1-27,29号之间的特征,以及对应的标签。学生需要处理数据,将其划分为训练集(train_new.data)和测试集(test_new.data),这一步骤涉及到使用`process_data.py`脚本。 3. **模型实现**: 实验涉及三个模型:线性分类(`linearclassification.py`)、朴素贝叶斯分类器(`nBayesClassifier.py`)和支持向量机(SVM,`SVM.py`)。这些模型将在`evaluation.py`中进行评估,计算Accuracy、F1-score等指标。 4. **性能度量**: 评价模型性能时,除了基本的准确率,还将计算F1-score,这是一个平衡了精确率和召回率的指标。此外,还会特别关注对于标签<=11的样本,可能有特定的评估规则,如TP、FP和FN的数量,以及精度限制在[1,7],[8,9],[10,11]这几个区间。 5. **代码结构**: 实验代码结构清晰,每个模型的训练和评估分别放在对应的`.py`文件中,通过命令行参数 `-data` 和 `--train_new.data`、`--test_new.data` 来指定输入的数据文件。`evaluation.py`负责整合各个模型的结果。 6. **实验流程**: 学生需要遵循实验流程,首先加载数据,然后训练模型,最后通过`linearclassification.py`、`nBayesClassifier.py`和`SVM.py`对模型进行评估,并输出结果到控制台或者报告中。 这篇文档详细规定了AI基础课程的第二阶段实验任务,重点在于应用PyTorch进行机器学习模型的开发、数据预处理和性能分析,旨在培养学生的实践能力,理解不同分类算法的工作原理以及如何在实际场景中运用这些技术。