import pandas as pd titanic=pd.read_csv('D:/Download/titanic-data.csv') data = pd.read_csv('D:/Download/titanic-data.csv') print(titanic.head(5)) X = titanic[['Pclass','Age','Sex']] y = titanic['Survived'] X.shape X.tail(5) X.info() mean_Age=X['Age'].mean() print(mean_Age) X['Age']=X['Age'].fillna(mean_Age) print(X.tail(5)) X['Pclass'] = X['Pclass' ].map({'1st':1, '2nd':2, '3rd':3}) X['Sex'] = X['Sex' ]. map({'female':0, 'male':1}) X. tail(5) from sklearn. preprocessing import MinMaxScaler scaler = MinMaxScaler() X_scaled = scaler.fit_transform(X) print (X_scaled) from sklearn.tree import DecisionTreeClassifier import numpy as np jack = np. array([[3, 23, 1]]) rose = np. array([[1, 20, 0]]) jack_scaled = scaler.transform (jack) rose_scaled = scaler.transform(rose) from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=100) dt_clf = DecisionTreeClassifier (max_depth=2, min_samples_split=2) dt_clf.fit(X_train, y_train) print(dt_clf.predict_proba(jack_scaled) [0][1]) print (dt_clf.predict_proba(rose_scaled) [0][1])
时间: 2024-02-23 12:56:33 浏览: 126
这是一个关于泰坦尼克号数据的代码,用于预测乘客是否生还。代码中用到了pandas库进行数据读取和处理,sklearn库中的MinMaxScaler对数据进行归一化处理,DecisionTreeClassifier对数据进行分类预测。其中,jack和rose分别代表“杰克”和“罗斯”这两个角色,他们的特征数据被输入到了模型中进行预测。
相关问题
import pandas as pd boston = pd.read_csv(C:/Users/BY/anaconda3/Lib/site-packages/sklearn/datasets/data/"boston_house_prices.csv")
在读取CSV文件时,你需要使用引号将文件路径括起来,因为文件路径中包含空格。另外,如果该文件不在当前工作目录中,你需要指明完整的文件路径。
以下是可能的代码示例:
```python
import pandas as pd
boston = pd.read_csv("C:/Users/BY/anaconda3/Lib/site-packages/sklearn/datasets/data/boston_house_prices.csv")
```
请根据你实际的文件路径进行相应的修改。
import pandas as pd data = pd.read_csv('D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/LB9LC30F0KALA6565.csv')
您好!您可以使用pandas库中的`read_csv`函数来读取CSV文件。根据您提供的代码,您想要读取名为'LB9LC30F0KALA6565.csv'的文件,该文件位于'D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/'目录下。
以下是示例代码:
```python
import pandas as pd
data = pd.read_csv('D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/LB9LC30F0KALA6565.csv')
```
请确保文件路径和文件名正确,并且已经安装了pandas库。如果文件存在且格式正确,`data`变量将包含CSV文件的数据。
阅读全文