fig = plt.figure(figsize=(20,5)) fig1 = plt.subplot(131) plt.scatter(data.loc[:,'面积'],data.loc[:,'价格']) plt.title('Price VS Size')
时间: 2023-11-27 11:05:58 浏览: 125
这段代码使用了matplotlib库来绘制散点图,其中fig = plt.figure(figsize=(20,5)) 创建了一个大小为20x5的画布对象,fig1 = plt.subplot(131) 创建了一个大小为1x3的子图对象,并将其作为第一个子图进行绘制。接着,plt.scatter(data.loc[:,'面积'],data.loc[:,'价格']) 绘制了以data数据集中的面积和价格为x和y轴的散点图,并使用plt.title('Price VS Size') 添加了图表的标题。
相关问题
def pic(df, name): import matplotlib.pyplot as plt plt.figure(figsize=(36, 12)) plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams["axes.unicode_minus"] = False grid = plt.GridSpec(4, 1, wspace=0, hspace=0) df['wnacwindspeed'].dropna() df['wgengenactivepw'].dropna() df.rename(columns={'temp_act': '检测风机', 'temp_avg': '平均风机', 'wnacwindspeed': '平均风速', 'wgengenactivepw': '有功功率'}, inplace=True) if not df.empty: fig = plt.figure(figsize=(19.2, 10.8), dpi=100) # 温度预警图 plt.subplot(211) plt.scatter(df['datatime'], df['检测风机'], color='r', label='检测风机值',s=1) plt.scatter(df['datatime'], df['平均风机'], color='g', label='健康参考值',s=1) plt.legend(fontsize=10, loc='best') plt.title(name, size=28) plt.grid() # 风速-功率曲线图 ax1 = fig.add_subplot(212) lns1 = ax1.plot(df['datatime'], df['平均风速'], color='#6495ED', label='风速',lw=1) ax2 = ax1.twinx() lns2 = ax2.plot(df['datatime'], df['有功功率'], color='#DAA520', label='功率',lw=1) lns = lns1 + lns2 labs = [l.get_label() for l in lns] ax1.legend(lns, labs, loc=0) ax1.grid() ax1.set_xlabel('datatime') ax1.set_ylabel('Wind Speed (m/s)', color='#6495ED', size=20) ax2.set_ylabel('Power (kW)', color='#DAA520', size=20) now = datetime.datetime.now() time_str = now.strftime("%Y-%m-%d") path = 'D:/LYTCO/result/' + time_str if not os.path.exists(path): os.makedirs(path) name = name.replace('/', '-') name = path + '/' + name + '.png' fig.tight_layout() plt.savefig(name, bbox_inches='tight') plt.close()
这段代码的作用是绘制一个包含两个子图的图片,第一个子图是温度预警图,第二个子图是风速-功率曲线图。在温度预警图中,使用散点图分别表示了检测风机和健康参考值在时间轴上的变化趋势。在风速-功率曲线图中,使用两个不同颜色的曲线分别表示了平均风速和有功功率在时间轴上的变化趋势。最后,将绘制好的图片保存到指定路径下的文件中。
hbin = 10 for i in tqdm(data['WindNumber'].unique()): col = 'WindSpeed' cond = (data.WindNumber==i) & (data.label == 0) temp_df = data[cond] h_bins = pd.cut(temp_df.Power, np.arange(-1000, 3000, hbin)) temp_df['hbins'] = h_bins groups = [] for index,temp in temp_df.groupby("hbins"): if temp.shape[0]==0: continue iqr = temp[col].quantile(0.75) - temp[col].quantile(0.25) t1 = temp[col].quantile(0.25) - 1.5 * iqr t2 = temp[col].quantile(0.75) + 1.5 * iqr temp = temp[((temp[col]<t1) | (temp[col]>t2))] groups.append(temp) groups = pd.concat(groups).reset_index(drop = True) cond = (data.WindNumber==i) & (data.Time.isin(groups.Time)) data.loc[cond,'label'] = 3 def vis_result_2D(df,label): fig = plt.figure(figsize=(16,6)) plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False ax = fig.add_subplot(121) for i in df['label'].unique(): temp_df = df[df['label']==i] ax.scatter(temp_df['WindSpeed'],temp_df['Power'],s=0.3,color=mcolors.TABLEAU_COLORS[colors[i]],label=i) plt.legend() plt.title("各类异常的分布") plt.grid(True) ax = fig.add_subplot(122) df = df[df['label']==0] ax.scatter(df['WindSpeed'],df['Power'],s=0.3) plt.title("清洗后的结果") plt.grid(True每行详细注释
这段代码是在对风力发电数据进行异常检测和清洗。首先,使用 tqdm 库对数据集中的风机编号进行遍历,对于每个风机编号进行以下操作:筛选出标签为0的数据,并将根据 Power 列的值分成 hbin 个区间,将每个数据点所在的区间标记为 hbins。接着,将 hbins 列进行分组,对于每个分组,计算 WindSpeed 列的 25% 分位数和 75% 分位数,根据这两个分位数和 1.5 倍的四分位距(IQR)计算出阈值 t1 和 t2,将 WindSpeed 列在 t1 和 t2 之外的数据点作为异常点,将这些异常点的标签设为3。最后,可视化不同标签的数据点在 WindSpeed-Power 平面上的分布情况,并将标签为0的数据点作为清洗后的结果进行展示。
阅读全文