# -- coding: utf-8 -- # 第一步:导入相关库 import pandas as pd from pandas.plotting import register_matplotlib_converters import numpy as np import matplotlib.dates as mdates import matplotlib.mlab as mlab import matplotlib.pyplot as plt from datetime import datetime register_matplotlib_converters() plt.figure(figsize=(20, 15)) # 第二步:读取CSV数据文件 book_list = pd.read_csv('chap7.csv', sep=',') book_list['discount_rate']=book_list['price_discount']/book_list['price_original'] # 图书折扣率 # 第三步:绘制第一个子图:评论数 x=book_list['rank'] ax1 = plt.subplot(221) y1=book_list['comment'] ax1.plot(x,y1,'bD-') # 第三步:绘制第二个子图:折后价和原价 ax2 = plt.subplot(222) y2=book_list['price_discount'] y3=book_list['price_original'] ax2.plot(x,y2,'r^-') ax2.plot(x,y3,'gH-') # 第三步:绘制第三个子图:折扣率 ax3 = plt.subplot(223) y4=(book_list['discount_rate']*100).round(1) ax3.plot(x,y4,'ks-') # 第三步:绘制第四个子图:出版日期 ax4 = plt.subplot(224) y5=[datetime.strptime(d, '%Y-%m-%d').date() for d in book_list['publish_date']] ax4.plot(x,y5,'m4-') # 第四步:图表展示 plt.show() 每一步都是为了什么
时间: 2024-01-10 16:03:19 浏览: 126
每一步都是为了完成特定的任务和数据可视化操作。让我为你解释一下每一步的目的:
第一步:导入相关库
这一步是为了导入所需的库和模块,包括pandas、numpy、matplotlib等,以便后续使用它们进行数据处理和绘图。
第二步:读取CSV数据文件
这一步是为了读取CSV格式的数据文件(chap7.csv),使用pd.read_csv()函数将数据加载到一个名为book_list的数据框中,以便后续对数据进行处理。
第三步:绘制子图
这一步是为了创建一个包含多个子图的大图。使用plt.subplot()函数创建四个子图,分别是评论数、折后价和原价、折扣率以及出版日期。然后,使用ax.plot()函数在每个子图上绘制相应的数据。
第四步:图表展示
这一步是为了展示绘制好的图表。使用plt.show()函数将所有子图显示在一个窗口中。
总体而言,这段代码的目的是读取CSV文件中的数据,并使用matplotlib库绘制出四个子图,分别展示评论数、折后价和原价、折扣率以及出版日期的变化情况。通过这些图表,可以更直观地了解和分析数据。
相关问题
# -*- coding: utf-8 -*- """ Created on Sat Sep 4 11:39:06 2021 @author: Zhuchunqiang """ import pandas as pd Stock_XRHJ = pd.read_csv('', index_col='Date', parse_dates=['Date'])如何把桌面的数据放到代码对应位置
你需要在 `pd.read_csv()` 中填入你的数据文件路径,例如 `C:/Users/YourUserName/Desktop/your_data.csv`。如果你的数据文件在桌面,那么你可以将路径写成 `C:/Users/YourUserName/Desktop/your_data.csv`。这样就可以将数据文件放到代码对应位置了。注意,路径中的斜杠必须是正斜杠 `/`,不能是反斜杠 `\`。
# -*-coding:utf-8-*- import pandas as pd import json import pprint # 读取csv文件 df = pd.read_csv('202205012-20230512.csv', header=None, skiprows=1, usecols=[1,2,3]) # 将数据转换为JSON格式 data = df.to_dict(orient='records') json_data = json.dumps(data) data_t = json.loads(json_data) for ele in data_t: print(ele['代码'])
这段代码的作用是读取一个csv文件,并将其中的数据转换为JSON格式,然后输出其中每行数据的“代码”这一列的值。
其中:
- 第1行声明编码格式为UTF-8;
- 第2行导入pandas库,用于数据处理;
- 第3行导入json库,用于JSON格式的编码和解码;
- 第5行利用pandas库读取csv文件(文件名为“202205012-20230512.csv”),跳过第1行表头,仅读取第2、3、4列(用cols参数指定),并将其转换为pandas的DataFrame对象df;
- 第8行将DataFrame对象df转换为JSON格式,存储在变量json_data中;
- 第10行将json_data解码为Python对象(即一个字典列表),存储在变量data_t中;
- 第12~14行遍历data_t中的每个字典元素,输出其中key为“代码”的value值。
阅读全文
相关推荐

















