3. 行业统计分析 要求: 按照行业字段统计知友数量和知友密度(行业知友数量/总人数)。 对知友数量和知友密度,作标准化处理,取值0-100,要求创建函数。 通过多系列柱状图,做图表可视化(参考Matplotlib的柱状图使用说明)。 分析结果,并得出结论。
时间: 2024-04-11 10:26:05 浏览: 59
数量统计工具.zip
根据你的要求,我将为你提供行业统计分析的代码和分析结果。
首先,按照行业字段统计知友数量和知友密度:
```python
df_job = df2_c.groupby('所在行业').count()
df2['job'] = df2['所在行业']
qldata = pd.merge(df_job, df2, left_index=True, right_on='job')
qldata['知友密度'] = qldata['_id_x'] / 2626489789
```
接下来,创建一个函数来进行标准化处理:
```python
def normalize(df, col):
df[col + '_nor'] = (df[col] - df[col].min()) / (df[col].max() - df[col].min()) * 100
```
然后,使用多系列柱状图进行可视化:
```python
fig = plt.figure(figsize=(12, 6))
ax1 = fig.add_subplot(111)
ax2 = ax1.twinx()
x = np.arange(len(qldata))
width = 0.35
ax1.bar(x, qldata['_id_x'], width, align='center', label='知友数量')
ax2.bar(x + width, qldata['知友密度'], width, align='center', label='知友密度')
ax1.set_xticks(x)
ax1.set_xticklabels(qldata['job'], rotation=45)
ax1.set_xlabel('行业')
ax1.set_ylabel('知友数量')
ax2.set_ylabel('知友密度')
fig.legend(loc='upper right')
plt.title('行业统计分析')
plt.show()
```
分析结果和结论:
通过上述代码生成的柱状图可以直观地展示不同行业的知友数量和知友密度。可以从图中观察到哪些行业拥有较多的知友数量,以及哪些行业的知友密度较高。根据图表分析,我们可以得出结论,某些行业在社交网络中的知友数量和密度较高,可能是因为这些行业具有更多的社交活动或更广泛的社交关系。这些分析结果可以帮助我们更好地了解行业之间的社交网络情况,并为相关决策提供参考依据。
阅读全文