python 编写一个对宝可梦数据集进行数据分析的程序
时间: 2024-02-25 22:56:39 浏览: 27
以下是一个使用Python进行宝可梦数据集分析的示例程序:
```python
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 读取宝可梦数据集
pokemon_df = pd.read_csv('pokemon.csv')
# 查看数据集的基本信息
print(pokemon_df.info())
# 查看各属性的分布情况
pokemon_df.drop(['#'], axis=1).hist(figsize=(12,10))
plt.show()
# 将属性值进行编码
pokemon_df = pd.get_dummies(pokemon_df, columns=['Type 1', 'Type 2'])
# 将数据集分为训练集和测试集
X = pokemon_df.drop(['Name', 'Legendary'], axis=1)
y = pokemon_df['Legendary']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 使用线性回归算法进行建模
model = LinearRegression()
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算模型的准确率
score = model.score(X_test, y_test)
print("模型准确率:", score)
```
上述程序首先读取了宝可梦数据集,然后使用Pandas库查看了数据集的基本信息,并使用Matplotlib库绘制了各属性的分布图表。
接着,程序将属性值进行编码,并将数据集分为训练集和测试集。使用Scikit-Learn库中的线性回归算法进行建模,并在测试集上进行预测。最后,程序计算了模型的准确率。
在实际应用中,还可以根据具体需求进行更加复杂的数据分析和建模。