import pandas as pd titanic=pd.read_csv('D:/Download/titanic-data.csv') data = pd.read_csv('D:/Download/titanic-data.csv') print(titanic.head(5)) X = titanic[['Pclass','Age','Sex']] y = titanic['Survived'] X.shape X.tail(5) X.info() mean_Age=X['Age'].mean() print(mean_Age) X['Age']=X['Age'].fillna(mean_Age) print(X.tail(5)) X['Pclass'] = X['Pclass' ].map({'1st':1, '2nd':2, '3rd':3}) X['Sex'] = X['Sex' ]. map({'female':0, 'male':1}) X. tail(5) from sklearn. preprocessing import MinMaxScaler scaler = MinMaxScaler() X_scaled = scaler.fit_transform(X) print (X_scaled) from sklearn.tree import DecisionTreeClassifier import numpy as np jack = np. array([[3, 23, 1]]) rose = np. array([[1, 20, 0]]) jack_scaled = scaler.transform (jack) rose_scaled = scaler.transform(rose) from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=100) dt_clf = DecisionTreeClassifier (max_depth=2, min_samples_split=2) dt_clf.fit(X_train, y_train) print(dt_clf.predict_proba(jack_scaled) [0][1]) print (dt_clf.predict_proba(rose_scaled) [0][1])在spyder该代码中出现ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
时间: 2024-02-23 22:56:33 浏览: 157
这个错误提示是因为在数据处理过程中,出现了缺失值NaN,或者出现了过大或过小的数值,导致无法进行后续的计算。可以使用`X.isnull().sum()`来查看每列缺失值的数量,然后使用`X.dropna()`或者`X.fillna()`函数来处理缺失值,将其填充为平均值、中位数、众数等。此外,还需要检查数据是否存在异常值,如将字符串类型的数据误认为是数字类型等。
相关问题
import pandas as pd boston = pd.read_csv(C:/Users/BY/anaconda3/Lib/site-packages/sklearn/datasets/data/"boston_house_prices.csv")
在读取CSV文件时,你需要使用引号将文件路径括起来,因为文件路径中包含空格。另外,如果该文件不在当前工作目录中,你需要指明完整的文件路径。
以下是可能的代码示例:
```python
import pandas as pd
boston = pd.read_csv("C:/Users/BY/anaconda3/Lib/site-packages/sklearn/datasets/data/boston_house_prices.csv")
```
请根据你实际的文件路径进行相应的修改。
import pandas as pd data = pd.read_csv('D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/LB9LC30F0KALA6565.csv')
您好!您可以使用pandas库中的`read_csv`函数来读取CSV文件。根据您提供的代码,您想要读取名为'LB9LC30F0KALA6565.csv'的文件,该文件位于'D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/'目录下。
以下是示例代码:
```python
import pandas as pd
data = pd.read_csv('D:/数字汽车大赛/2023年数字汽车大赛创新组赛题二数据/LB9LC30F0KALA6565.csv')
```
请确保文件路径和文件名正确,并且已经安装了pandas库。如果文件存在且格式正确,`data`变量将包含CSV文件的数据。
阅读全文