import numpy as np import scipy.stats as ss import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df=pd.read_csv("./HR.csv") dp_indices=df.groupby(by="department").indices sales_values=df["left"].iloc[dp_indices["sales"]].values technical_vlues=df["left"].iloc[dp_indices["technical"]].values dp_keys=list(dp_indices.keys()) dp_t_mat=np.zeros([len(dp_keys)],[len(dp_keys)]) for i in range(len(dp_keys)): for j in range(len(dp_keys)): p_vlaue=ss.ttest_ind(df["left"].iloc[dp_indices[dp_keys[i]]].values,\ df["left"].iloc[dp_indices[dp_keys[j]]].values)[1] dp_t_mat[i][j]=p_value sns.heatmap(dp_t_mat,xticklabels=dp_keys,yticklabels=dp_keys) plt.show()提示Field elements must be 2- or 3-tuples, got '10'
时间: 2023-11-27 15:50:20 浏览: 62
这个错误信息提示说期望的输入应该是2-或3元组,但是你传入的是一个整数'10'。根据你的代码,这个错误很可能是由于你在创建dp_t_mat数组的时候,使用了不正确的方式来指定数组的形状。
可以看到,你创建dp_t_mat数组的时候,使用的是np.zeros函数,但是你只传入了一个参数,这个参数是一个长度为len(dp_keys)的一维数组。正确的方式应该是传入一个二元组,表示数组的形状,就像这样:
```
dp_t_mat = np.zeros([len(dp_keys), len(dp_keys)])
```
这样就能够创建一个二维数组,第一维的长度为len(dp_keys),第二维的长度也为len(dp_keys),然后你就可以在这个数组中存储你计算得到的p值了。
相关问题
import numpy as np import scipy.stats as ss import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df=pd.read_excel("./tmp_apply3.xlsx")读入后怎么取字段
你可以使用 Pandas 的 `loc` 或 `iloc` 方法来取出 DataFrame 中的特定字段。具体而言,`loc` 方法可以通过列名来取出字段,而 `iloc` 方法可以通过列的索引来取出字段。以下是两种方法的示例:
假设你要取出 `df` 中的 `sale` 和 `date` 两个字段,其中 `sale` 字段在第 2 列,`date` 字段在第 3 列,你可以这样做:
使用 `loc` 方法:
```python
# 通过列名取出字段
df_new = df.loc[:, ["sale", "date"]]
```
使用 `iloc` 方法:
```python
# 通过列的索引取出字段
df_new = df.iloc[:, [1, 2]]
```
上述代码中,`df_new` 就是取出 `df` 中的 `sale` 和 `date` 两个字段后得到的新 DataFrame。其中 `:` 表示取出所有行,`["sale", "date"]` 或 `[1, 2]` 表示取出第 2 列和第 3 列。你可以根据实际需要修改这些代码。
阅读全文