4 print(df["NUM_BEDROOMS".isnull()]) AttributeError: 'str' object has no attribute 'isnull'
时间: 2024-01-21 08:14:50 浏览: 170
根据提供的引用内容,您想要打印出DataFrame中"NUM_BEDROOMS"列中的空值。然而,您遇到了一个错误,即"'str' object has no attribute 'isnull'"。这个错误是因为您错误地将"isnull()"方法应用于字符串对象上,而不是应用于DataFrame对象上。
要解决这个问题,您需要确保您的df变量是一个DataFrame对象。您可以使用pandas库中的read_csv()函数来读取CSV文件并创建一个DataFrame对象。然后,您可以使用"isnull()"方法来检查DataFrame中的空值。
下面是一个示例代码,演示了如何打印出DataFrame中"NUM_BEDROOMS"列中的空值:
```python
import pandas as pd
# 读取CSV文件并创建DataFrame对象
df = pd.read_csv("Melbourne_housing_extra_data.csv")
# 打印出"NUM_BEDROOMS"列中的空值
print(df["NUM_BEDROOMS"].isnull())
```
请注意,您需要将"Melbourne_housing_extra_data.csv"替换为您实际的CSV文件路径。
相关问题
import pandas as pd df = pd.read_csv('property-data.csv') print (df['NUM_BEDROOMS']) print (df['NUM_BEDROOMS'].isnull())这段代码什么意思
这段代码的意思是:
1. 首先,使用 `import pandas as pd` 导入 pandas 库。
2. 然后,使用 `pd.read_csv` 函数读取名为 `property-data.csv` 的 CSV 文件,并将其存储在变量 `df` 中。
3. 接下来,使用 `print(df[NUM_BEDROOMS])` 输出 `df` 中名为 `NUM_BEDROOMS` 的列的值。
4. 最后,使用 `print(df[NUM_BEDROOMS].isnull())` 输出 `df` 中名为 `NUM_BEDROOMS` 的列的缺失值情况,如果该值为缺失值,则输出 `True`,否则输出 `False`。
这段代码的作用是读取 CSV 文件,然后输出名为 `NUM_BEDROOMS` 的列的值,并检查该列的缺失值情况。
import pandas as pd data=pd.read_csv('housing.csv') total_bedrooms_mean=data['total_bedrooms'].mean() data['total_bedrooms'].fillna(total_bedrooms_mean,inplace=True) onehot=pd.get_dummies((data[['ocean_proximity']]),prefix='ocean_proximity') data.drop(columns = ['ocean_proximity'],inplace=True) X=pd.concat([data['housing_median_age'],data['total_rooms'],data['total_bedrooms'],data['population'],data['households'],data['median_income'],onehot],axis=1) y=data[["median_house_value"]] from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,random_state=42) from sklearn.linear_model import LinearRegression lin_reg=LinearRegression() lin_reg.fit(X_train,y_train) y_pre=lin_reg.predict(X_test) from sklearn import metrics metrics.accuracy_score(y_test,y_pre)报错import pandas as pd data=pd.read_csv('housing.csv') total_bedrooms_mean=data['total_bedrooms'].mean() data['total_bedrooms'].fillna(total_bedrooms_mean,inplace=True) onehot=pd.get_dummies((data[['ocean_proximity']]),prefix='ocean_proximity') data.drop(columns = ['ocean_proximity'],inplace=True) X=pd.concat([data['housing_median_age'],data['total_rooms'],data['total_bedrooms'],data['population'],data['households'],data['median_income'],onehot],axis=1) y=data[["median_house_value"]] from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,random_state=42) from sklearn.linear_model import LinearRegression lin_reg=LinearRegression() lin_reg.fit(X_train,y_train) y_pre=lin_reg.predict(X_test) from sklearn import metrics metrics.accuracy_score(y_test,y_pre)
这个代码会报错,因为`metrics.accuracy_score()`是用于分类问题的指标,而这里是回归问题,所以不能使用该指标。
如果你想评估回归模型的性能,可以使用回归指标,如均方误差(mean squared error, MSE)、均方根误差(root mean squared error, RMSE)或平均绝对误差(mean absolute error, MAE)。例如,使用MSE指标可以这样计算:
```
from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, y_pre)
print(mse)
```
请注意,当使用不同的指标时,解释和解读结果的方式也会有所不同,因此请根据你的具体问题和数据类型选择适当的指标。
阅读全文
相关推荐
















