font = {'family':'SimHei','size':18}#调节字体 import matplotlib import math def sigmoid(x): sig_y = 1/(1 + math.exp(-x)) return sig_y def prediction_function(age_list): fz = [] for age in age_list: y = clf.intercept_ + clf.coef_*age fz.append(sigmoid(y)) return fz plt.scatter(X_train,y_train,color = 'blue',label = '训练集') plt.scatter(X_test,y_test,color = 'red',label = '测试集') plt.plot(df.age.sort_values(),prediction_function(df.age.sort_values()), color = 'yellow') plt.legend(loc=2) plt.xlabel('年龄') plt.ylabel('买保险的概率')
时间: 2024-01-13 09:04:07 浏览: 24
这段代码是关于机器学习中 logistic 回归的可视化部分,它绘制了训练集和测试集的散点图,并用黄色的曲线表示 logistic 回归模型的预测结果。其中,sigmoid 函数用于将线性回归的结果转换为概率值,prediction_function 函数用于计算给定年龄列表的预测结果。而这段代码中的 clf 是 logistic 回归模型的对象。
相关问题
import matplotlib as mpl zhfont = mpl.font_manager.FontProperties(fname='/content/drive/MyDrive/simhei.ttf')什么意思
这段代码的作用是设置 Matplotlib 库中的字体属性,其中 `simhei.ttf` 是一种中文字体,用于在图形中显示中文。具体来说,代码首先导入了 Matplotlib 库,然后通过 `mpl.font_manager` 模块中的 `FontProperties()` 函数设置了字体文件的路径,即 `/content/drive/MyDrive/simhei.ttf`。这样,在之后的绘图过程中,就可以使用该字体来显示中文。
import csv chinese=[] number=[] with open('./数据1.csv', 'r', encoding='gbk') as file: reader = csv.reader(file) for row in reader: # print(row) # 第一竖列中文 chinese.append(row[0][0:3]) # 第二竖列去掉最后一个符号万 number.append(row[1][:-1]) print(chinese[1:]) print(number[1:]) #显示出来排名前20的品牌和价格 import matplotlib.pyplot as plt from wordcloud import WordCloud import matplotlib sorted_list = sorted(number[1:], reverse=True) top_10 = sorted_list[:20] top_10_indices = [number.index(num) for num in top_10[:20]] print(top_10) print(top_10_indices) result = [chinese[i] for i in top_10_indices] print(result) # 画折线图 font = {'family': 'SimHei', "size": 24} matplotlib.rc('font', **font) plt.plot(result, top_10) plt.tick_params(axis='x', labelsize=8) plt.tick_params(axis='y', labelsize=8) plt.show() # 画柱状图 plt.bar(result, top_10,width=0.5) plt.tick_params(axis='x', labelsize=8) plt.tick_params(axis='y', labelsize=8) plt.show() def generate_wordcloud(text): # 生成词云对象 wc = WordCloud( font_path='C:/Windows/Fonts/simhei.ttf', # 设置字体 background_color='white', # 设置背景颜色 max_words=200, # 设置最大显示的单词数量 max_font_size=100 # 设置最大的字体大小 ) # 生成词云 wc.generate(text) # 显示词云 plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show() # 将列表转换为字符串 text = ' '.join(result) # 生成词云 generate_wordcloud(text) #价格热力图 import plotly.graph_objs as go from plotly.subplots import make_subplots # 创建子图 fig = make_subplots(rows=1, cols=1) # 添加热力图 fig.add_trace(go.Heatmap(z=[top_10], x=result, y=['']), row=1, col=1) # 更新布局 fig.update_layout(title='价格热力图', xaxis_title='价格', yaxis_title='') # 保存为html文件 fig.write_html('./热力图.html')这里的三个错误怎么改正
这段代码中的三个错误应该是:
1. 在导入 `matplotlib` 时,应该将其重命名为 `plt`,否则在代码中需要频繁使用 `matplotlib` 会显得冗长。
2. 在生成柱状图时,`plt.bar()` 函数中的 `width` 参数应该是 0.8,而不是 0.5。
3. 在生成热力图时,`z` 参数应该是一个二维数组,而不是一个一维数组。可以将 `top_10` 列表转换为二维数组再传入 `z` 参数中。
以下是修改后的代码:
```python
import csv
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import plotly.graph_objs as go
from plotly.subplots import make_subplots
chinese = []
number = []
with open('./数据1.csv', 'r', encoding='gbk') as file:
reader = csv.reader(file)
for row in reader:
chinese.append(row[0][0:3])
number.append(row[1][:-1])
top_10 = sorted(number[1:], reverse=True)[:20]
top_10_indices = [number.index(num) for num in top_10[:20]]
result = [chinese[i] for i in top_10_indices]
# 画折线图
font = {'family': 'SimHei', "size": 24}
plt.rc('font', **font)
plt.plot(result, top_10)
plt.tick_params(axis='x', labelsize=8)
plt.tick_params(axis='y', labelsize=8)
plt.show()
# 画柱状图
plt.bar(result, top_10, width=0.8)
plt.tick_params(axis='x', labelsize=8)
plt.tick_params(axis='y', labelsize=8)
plt.show()
# 生成词云
def generate_wordcloud(text):
wc = WordCloud(
font_path='C:/Windows/Fonts/simhei.ttf',
background_color='white',
max_words=200,
max_font_size=100
)
wc.generate(text)
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
text = ' '.join(result)
generate_wordcloud(text)
# 价格热力图
fig = make_subplots(rows=1, cols=1)
z = [top_10]
z = [z] # 将一维数组转换为二维数组
fig.add_trace(go.Heatmap(z=z, x=result, y=['']), row=1, col=1)
fig.update_layout(title='价格热力图', xaxis_title='价格', yaxis_title='')
fig.write_html('./热力图.html')
```