波特兰房价预测：监督学习导论——线性回归与多元模型

需积分: 0 162 浏览量更新于2024-07-18 收藏 223KB PDF 举报

在Dr. Andrew Ng的CS229课程讲义中，我们深入探讨了监督学习的基本概念和应用。本讲义分为三个部分：线性回归、分类和逻辑回归，以及广义线性模型。这里以一个实际问题为例，探讨如何利用监督学习预测波特兰房价。首先，监督学习的关键在于解决有标签的数据问题，即已知输入（特征）和期望输出（目标）的情况。在这个例子中，输入特征（x(i)）是房屋的居住面积（以平方英尺计），输出变量（y(i)）是对应的房屋价格（以1000美元为单位）。数据集包含47个房子的实例，每对（x(i), y(i)）称为一个训练样本，整个数据集是学习的基础，由m个训练样本组成。通过观察提供的数据，我们想要建立一个函数，能够基于房屋居住面积预测在波特兰其他房屋的价格。为了建立这种预测模型，我们将使用线性回归作为基础方法。线性回归是一种简单而强大的工具，它假设输出变量与输入变量之间存在线性关系，我们的目标是找到一条最佳拟合直线（或超平面，对于多维输入）来最小化预测值与真实值之间的误差。在part1的线性回归部分，我们会学习如何通过最小二乘法找到这条直线的系数，以便用线性函数y = wx + b来近似数据中的价格趋势，其中w是权重向量，b是截距。通过调整这些参数，我们可以估计新房子的价格，即使没有给出确切的居住面积，也能做出预测。接着，在part2，我们会转向分类和逻辑回归。在这个背景下，如果价格预测不是连续的数值而是离散的类别（如房屋是否是高端市场），我们就需要将线性回归模型转化为逻辑回归，这是一种用于处理二分类问题的模型。逻辑回归通过sigmoid函数将线性组合转换为概率形式，使得预测结果更加直观，便于理解和解释。最后，在part3的广义线性模型部分，我们扩展到更一般的回归模型，考虑那些输入和输出之间的关系可能不完全是线性的，或者输出具有非正态分布的情况。这可能包括指数回归、多项式回归等，它们提供了更大的灵活性，适用于不同类型的预测任务。通过CS229讲义中的监督学习部分，学生可以掌握从实际数据中提取规律，构建预测模型，并运用线性回归、逻辑回归和广义线性模型解决各种现实世界问题的能力。这些理论知识和实践经验将为从事机器学习、数据分析等相关领域的职业发展打下坚实的基础。

5 10 15 20 25 30 35 40 45 50

The ellipses shown above are the contours of a quadratic function. Also

shown is the trajectory taken by gradient descent, which was initialized at

(48,30). The x’s in the ﬁgure (joined by straight lines) mark the successive

values of θ that gradient descent went through.

When we run batch gradient descent to ﬁt θ on our previous dataset,

to learn to predict housing price as a function o f living area, we obtain

= 71.27, θ

= 0.1345 . If we plot h

(x) as a function of x (area), a long

with the training data, we obtain the following ﬁgure:

500 1000 1500 2000 2500 3000 3500 4000 4500 5000

100

200

300

400

500

600

700

800

900

1000

housing prices

square feet

price (in $1000)

If the number of bedrooms were included as one of the input features as well,

we get θ

= 89.60, θ

= 0.1392, θ

= −8.738.

The above results were obtained with batch gradient descent. There is

an alternative to batch gradient descent that also works very well. Consider

the following algorithm:

剩余29页未读，继续阅读

wym1674

粉丝: 0
资源: 1

波特兰房价预测：监督学习导论——线性回归与多元模型

监督学习与无监督学习

斯坦福大学机器学习课程cs229原始讲义

吴恩达CS229机器学习讲义：监督学习与房价预测

斯坦福CS229机器学习讲义解析：监督学习与模式识别

斯坦福CS229机器学习讲义：房价预测与监督学习

斯坦福CS229机器学习讲义：线性回归与监督学习

吴恩达机器学习讲义：监督学习与房价预测

吴恩达斯坦福机器学习讲义：监督学习与房价预测

斯坦福CS229课程：机器学习笔记与活动存储库指南

斯坦福大学机器学习CS229课程讲义（2019秋）：监督学习与深度学习概述

最新资源