fig = plt.figure(figsize=(20,5)) fig1 = plt.subplot(131) plt.scatter(data.loc[:,'面积'],data.loc[:,'价格']) plt.title('Price VS Size')

这段代码使用了matplotlib库来绘制散点图，其中fig = plt.figure(figsize=(20,5)) 创建了一个大小为20x5的画布对象，fig1 = plt.subplot(131) 创建了一个大小为1x3的子图对象，并将其作为第一个子图进行绘制。接着，plt.scatter(data.loc[:,'面积'],data.loc[:,'价格']) 绘制了以data数据集中的面积和价格为x和y轴的散点图，并使用plt.title('Price VS Size') 添加了图表的标题。

def pic(df, name): import matplotlib.pyplot as plt plt.figure(figsize=(36, 12)) plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams["axes.unicode_minus"] = False grid = plt.GridSpec(4, 1, wspace=0, hspace=0) df['wnacwindspeed'].dropna() df['wgengenactivepw'].dropna() df.rename(columns={'temp_act': '检测风机', 'temp_avg': '平均风机', 'wnacwindspeed': '平均风速', 'wgengenactivepw': '有功功率'}, inplace=True) if not df.empty: fig = plt.figure(figsize=(19.2, 10.8), dpi=100) # 温度预警图 plt.subplot(211) plt.scatter(df['datatime'], df['检测风机'], color='r', label='检测风机值',s=1) plt.scatter(df['datatime'], df['平均风机'], color='g', label='健康参考值',s=1) plt.legend(fontsize=10, loc='best') plt.title(name, size=28) plt.grid() # 风速-功率曲线图 ax1 = fig.add_subplot(212) lns1 = ax1.plot(df['datatime'], df['平均风速'], color='#6495ED', label='风速',lw=1) ax2 = ax1.twinx() lns2 = ax2.plot(df['datatime'], df['有功功率'], color='#DAA520', label='功率',lw=1) lns = lns1 + lns2 labs = [l.get_label() for l in lns] ax1.legend(lns, labs, loc=0) ax1.grid() ax1.set_xlabel('datatime') ax1.set_ylabel('Wind Speed (m/s)', color='#6495ED', size=20) ax2.set_ylabel('Power (kW)', color='#DAA520', size=20) now = datetime.datetime.now() time_str = now.strftime("%Y-%m-%d") path = 'D:/LYTCO/result/' + time_str if not os.path.exists(path): os.makedirs(path) name = name.replace('/', '-') name = path + '/' + name + '.png' fig.tight_layout() plt.savefig(name, bbox_inches='tight') plt.close()

这段代码的作用是绘制一个包含两个子图的图片，第一个子图是温度预警图，第二个子图是风速-功率曲线图。在温度预警图中，使用散点图分别表示了检测风机和健康参考值在时间轴上的变化趋势。在风速-功率曲线图中，使用两个不同颜色的曲线分别表示了平均风速和有功功率在时间轴上的变化趋势。最后，将绘制好的图片保存到指定路径下的文件中。

hbin = 10 for i in tqdm(data['WindNumber'].unique()): col = 'WindSpeed' cond = (data.WindNumber==i) & (data.label == 0) temp_df = data[cond] h_bins = pd.cut(temp_df.Power, np.arange(-1000, 3000, hbin)) temp_df['hbins'] = h_bins groups = [] for index,temp in temp_df.groupby("hbins"): if temp.shape[0]==0: continue iqr = temp[col].quantile(0.75) - temp[col].quantile(0.25) t1 = temp[col].quantile(0.25) - 1.5 * iqr t2 = temp[col].quantile(0.75) + 1.5 * iqr temp = temp[((temp[col]<t1) | (temp[col]>t2))] groups.append(temp) groups = pd.concat(groups).reset_index(drop = True) cond = (data.WindNumber==i) & (data.Time.isin(groups.Time)) data.loc[cond,'label'] = 3 def vis_result_2D(df,label): fig = plt.figure(figsize=(16,6)) plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False ax = fig.add_subplot(121) for i in df['label'].unique(): temp_df = df[df['label']==i] ax.scatter(temp_df['WindSpeed'],temp_df['Power'],s=0.3,color=mcolors.TABLEAU_COLORS[colors[i]],label=i) plt.legend() plt.title("各类异常的分布") plt.grid(True) ax = fig.add_subplot(122) df = df[df['label']==0] ax.scatter(df['WindSpeed'],df['Power'],s=0.3) plt.title("清洗后的结果") plt.grid(True每行详细注释

这段代码是在对风力发电数据进行异常检测和清洗。首先，使用 tqdm 库对数据集中的风机编号进行遍历，对于每个风机编号进行以下操作：筛选出标签为0的数据，并将根据 Power 列的值分成 hbin 个区间，将每个数据点所在的区间标记为 hbins。接着，将 hbins 列进行分组，对于每个分组，计算 WindSpeed 列的 25% 分位数和 75% 分位数，根据这两个分位数和 1.5 倍的四分位距（IQR）计算出阈值 t1 和 t2，将 WindSpeed 列在 t1 和 t2 之外的数据点作为异常点，将这些异常点的标签设为3。最后，可视化不同标签的数据点在 WindSpeed-Power 平面上的分布情况，并将标签为0的数据点作为清洗后的结果进行展示。

阅读全文

fig = plt.figure(figsize=(20,5)) fig1 = plt.subplot(131) plt.scatter(data.loc[:,'面积'],data.loc[:,'价格']) plt.title('Price VS Size')

相关推荐

python比大小（超简单代码）

Python数据科学速查表-Matplotlib 绘图.pdf

Python数据科学速查表 - Matplotlib 绘图.pdf

【Numpy.random入门指南】：快速掌握随机数生成的10个技巧

plt.subplot2grid()

有3个变量，x_range=[0, 10, 1], y_range=[0, 10, 1],z_range=[1.5, 1.6],以这3个变量为坐标轴组成一个网格，从网格上的随机一个点出发依次遍历网格上相邻的每个点，给出代码，使用python编写代码绘制一段动画描述该过程

seaborn.PairGrid.map_offdiag的用法和举例

输入大小为45×5，输出大小为45×1，输入变量为五维，输出变量为一维，用上述已知数据训练一个PCE代理模型，包括后续的预测、可视化和不确定性量化，请给出python代码

前端面试攻略（前端面试题、react、vue、webpack、git等工具使用方法）

常用的java基础类包括MD5、错误处理、映射、服务等等

大家在看

台达变频器资料.zip

有限元软件Patran的二次开发语言PCL入门笔记

电力行业数字化转型智慧电力一体化监管云平台整体解决方案.docx

摩托车ECU硬件设计，程序源代码需自己开发

多无人机和实时局部轨迹规划最佳防撞算法附matlab代码.zip

最新推荐

Python绘图之二维图与三维图详解

使用matplotlib动态刷新指定曲线实例

前端面试攻略（前端面试题、react、vue、webpack、git等工具使用方法）

租赁合同编写指南及下载资源

【项目管理精英必备】：信息系统项目管理师教程习题深度解析（第四版官方教材全面攻略）

最具代表性的改进过的UNet有哪些？

惠普P1020Plus驱动下载：办公打印新选择

数字电路实验技巧：10大策略，让你的实验效率倍增！

altium designer布线

Rust与OpenGL共同打造的迷宫游戏