线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)
时间: 2023-10-04 09:10:17 浏览: 116
好的,这是一个经典的机器学习问题。以下是实现线性回归预测PM2.5的步骤:
1. 数据准备:从台湾环境保护署所提供的空气品质观测数据中,选取12个月份的每天24小时的资料,总共有12*24=288个数据点。每个数据点包含18个特征和1个标签(即PM2.5浓度)。可以使用pandas库来读取数据,处理数据等。
2. 特征工程:将原始数据转换为模型能够使用的特征。具体来说,可以采用以下方法:
(1)将时间序列转换为连续的序列,例如使用前9小时的空气质量数据来预测第10小时的PM2.5浓度。
(2)对于缺失值,可以使用均值或者中位数进行填充。
(3)可以考虑添加一些新的特征,例如时间戳、一些统计特征等。
3. 模型训练:将数据分为训练集和验证集(测试集),使用训练集进行模型的训练,采用梯度下降法或者正规方程法求解线性回归模型的参数。训练过程中,需要注意正则化,以避免过拟合。
4. 模型评估:使用验证集进行模型的评估,计算出模型的RMSE(均方根误差)等指标。
5. 模型预测:使用训练好的模型对测试集进行预测,生成预测结果。可以将预测结果保存为csv文件,并将其提交到比赛平台上进行评估。
在实现过程中,可以参考台大李宏毅老师的课程作业,里面有详细的代码和实现过程。
相关问题
李宏毅机器学习 hw1
回答: 李宏毅的机器学习课程中的hw1是关于线性回归任务的。这个作业的重点在于对原始数据的处理和线性回归训练的过程。学生通过分析目标,使用kaggle波士顿房价预测来提升作业1的性能。在这个过程中,有一篇博客文章提到了如何通过神经网络来确定输入的重要性[2]。此外,还有一个问题讨论了神经网络是否需要具有正态分布的数据[3]。
李宏毅2023 机器学习hw1
李宏毅2023年机器学习课程的第一次作业是回归问题(Regression)。根据引用\[3\]中的信息,助教们已经介绍了作业的内容解读、Kaggle提交介绍、代码调参提示和样例代码详解。此外,还有两个先修视频可以作为参考,这些视频已经搬运至知乎和B站。你可以通过访问课程网站(https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php)获取更多关于作业的详细信息。希望这些信息对你完成李宏毅2023机器学习课程的第一次作业有所帮助。
#### 引用[.reference_title]
- *1* *2* *3* [【深度解析→博文总结】李宏毅机器学习2023作业01Regression(COVID-19 Cases Prediction)](https://blog.csdn.net/qq_39975984/article/details/129276170)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]