data['Survived'].value_counts().plot(kind='Bar',alpha=0.8)ValueError: Bar is not a valid plot kind
时间: 2023-12-31 17:03:14 浏览: 198
该错误是由于在plot函数中使用了无效的绘图类型"Bar"导致的。正确的绘图类型应该是"bar"。
正确的代码应该是:
```
data['Survived'].value_counts().plot(kind='bar', alpha=0.8)
```
请注意,绘图类型应该是小写的"bar",而不是大写的"Bar"。
相关问题
这串代码结果显示Bar不是有效的plot kind,要如何改进。import pandas as pd data = pd.read_excel('titanic.xls') print(data.sex.unique()) data.loc[data['sex']=='male','sex']=0 data.loc[data['sex']=='female','sex']=1 survive_0 = data['survived'][data['sex']==0].value_counts() survive_1 = data['survived'][data['sex']==1].value_counts() data1 =pd.DataFrame({'获救': survive_1,'未获救': survive_0}) data1.plot(kind='Bar',stacked=True) plt.title('不同性别的获救比例')
把 `Bar` 改为 `bar` 即可,这个错误是因为大小写不匹配导致的。修改后的代码如下:
```
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_excel('titanic.xls')
print(data.sex.unique())
data.loc[data['sex']=='male','sex']=0
data.loc[data['sex']=='female','sex']=1
survive_0 = data['survived'][data['sex']==0].value_counts()
survive_1 = data['survived'][data['sex']==1].value_counts()
data1 = pd.DataFrame({'获救': survive_1,'未获救': survive_0})
data1.plot(kind='bar', stacked=True)
plt.title('不同性别的获救比例')
plt.show()
```
注意最后需要加上 `plt.show()` 才能显示图像。
survived = data[data['survived'] == 1]['sex'] not_survived = data[data['survived'] == 0]['sex'] survived_ratio = survived.value_counts() / len(survived) not_survived_ratio = not_survived.value_counts() / len(not_survived) # 使用t检验验证两个样本之间的差异 t_stat, p_val = stats.ttest_ind(survived, not_survived, equal_var=False) print('survived ratio by sex:') print(survived_ratio) print('Not survived ratio by sex:') print(not_survived_ratio) print('t-statistic:', t_stat) print('p-value:', p_val) survived ratio by sex: 0 0.681287 1 0.318713 Name: sex, dtype: float64 Not survived ratio by sex: 1 0.852459 0 0.147541 Name: sex, dtype: float64 t-statistic: -18.134562886672246 p-value: 1.243793777062186e-58
这段代码是用来分析 Titanic 数据集中不同性别在生还和未生还中的比例,并使用 t 检验验证两个样本之间的差异。其中 survived_ratio 和 not_survived_ratio 分别表示生还和未生还样本中不同性别的比例,t_stat 和 p_val 分别表示 t 统计量和 p 值。t 统计量用于衡量两个样本均值的差异性,p 值用于衡量差异的显著性。在这个例子中,p 值非常小,接近于 0,说明两个样本之间的差异非常显著,即性别在生还和未生还中具有很大的影响。
阅读全文