用python编写线性回归预测乐高价格。
时间: 2024-09-29 22:15:53 浏览: 67
在Python中,我们可以使用scikit-learn库来编写简单的线性回归模型来预测乐高积木的价格。线性回归是一种基本的机器学习算法,它假设特征和目标变量之间存在线性关系。下面是一个简化的步骤:
1. **数据获取**:首先需要收集关于乐高积木的数据,如型号、尺寸、年份、稀缺度等作为特征,以及实际售价作为目标值。
2. **导入库**:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
```
3. **数据预处理**:
```python
# 加载数据集,假设有DataFrame叫做df
df = pd.read_csv('lego_prices.csv') # 假设数据存储在一个CSV文件中
# 数据清洗,缺失值处理
df.fillna(df.mean(), inplace=True) # 或者使用其他填充策略
# 定义特征X和目标值y
X = df.drop('price', axis=1)
y = df['price']
```
4. **拆分数据**:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
```
5. **创建并训练模型**:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
6. **预测和评估**:
```python
y_pred = model.predict(X_test)
# 计算相关指标如R²分数
score = metrics.r2_score(y_test, y_pred)
print(f"R² Score: {score}")
```
7. **保存模型**(如果需要长期使用):
```python
import joblib
joblib.dump(model, 'lego_price_predictor.pkl')
```
阅读全文