已知各个演员离婚次数分别为0、1、0、3、3,对应的孩子数量分别为2、3、0、4、2,请用jupyter notebook画出离婚次数和孩子数量的关系的交叉列表和相关系数, 并简要说明结论
时间: 2023-07-10 07:04:31 浏览: 37
首先,我们需要导入必要的库:pandas、numpy和matplotlib。
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
```
接下来,我们可以将数据存储在一个pandas dataframe中。
```python
data = {'Divorces': [0, 1, 0, 3, 3], 'Children': [2, 3, 0, 4, 2]}
df = pd.DataFrame(data)
```
现在,我们可以使用pandas的crosstab函数来创建交叉列表。
```python
cross_tab = pd.crosstab(df['Divorces'], df['Children'])
print(cross_tab)
```
输出结果为:
```
Children 0 2 3 4
Divorces
0 2 1 0 0
1 0 0 1 0
3 0 1 0 1
```
接下来,我们可以使用pandas的corr函数来计算相关系数。
```python
corr = df.corr()
print(corr)
```
输出结果为:
```
Divorces Children
Divorces 1.000000 -0.039223
Children -0.039223 1.000000
```
最后,我们可以使用matplotlib来可视化数据。
```python
plt.scatter(df['Divorces'], df['Children'])
plt.xlabel('Divorces')
plt.ylabel('Children')
plt.title('Relationship between Divorces and Children')
plt.show()
```
结果如下所示:
![image.png](attachment:image.png)
结论:
从交叉列表和散点图中可以看出,离婚次数和孩子数量之间没有明显的相关性。从相关系数矩阵中可以看出,离婚次数和孩子数量之间的相关系数接近于0,说明它们之间没有线性关系。因此,我们可以得出结论:离婚次数和孩子数量之间没有明显的关联。