import pandas as pd from matplotlib import pyplot as plt from matplotlib import rcParams from config import * rcParams['font.family'] = 'simhei' df = pd.read_excel(file_name, dtype={ '年份': int, '值': float }) ax = df.plot(x='年份', y='值', figsize=(15, 10), kind=pandas_type) if pandas_type == 'line' or pandas_type == 'scatter': ax.set_xticks(df['年份']) unit = df['单位'].to_list()[0] ax.tick_params(axis='both', labelsize=14) ax.set_xlabel("年份", fontsize=14) ax.set_ylabel(f'值(单位:{unit})', fontsize=14) ax.set_title(title, fontsize=16) plt.show()
时间: 2023-11-28 18:03:57 浏览: 64
这段代码的功能是读取一个Excel文件并绘制数据的可视化图形。其中使用了 Pandas 库来读取 Excel 文件,Matplotlib 库来绘制图形。代码中的 rcParams 部分用于设置字体,保证中文显示正常。函数的参数中包括文件名、绘图类型、标题等。绘制出的图形可以是线图或散点图,根据不同的类型设置不同的参数。最后调用 plt.show() 显示绘制出的图形。
相关问题
分析下列代码:import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel("E:\\爬取\\爬取.xls") year_count = data.groupby(by="年份")["年份"].count() data['年份'] = pd.to_numeric(data['年份'], errors='coerce') plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams['axes.unicode_minus'] = False plt.plot(year_count.index, year_count.values) plt.title("电影年份发展折线图") plt.xlabel("年份") plt.ylabel("数量") plt.show() import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel("E:\\爬取\\爬取.xls") plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams['axes.unicode_minus'] = False year_count = data['国家'].value_counts() plt.bar(year_count.index, year_count.values) plt.title("各个国家电影数量") plt.xlabel("国家") plt.ylabel("电影数量") plt.show() import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel("E:\\爬取\\爬取.xls") plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams['axes.unicode_minus'] = False type_count = data["类型"].value_counts() plt.pie(type_count,labels=type_count.index,pctdistance=0.8,autopct='%1.1f%%',explode=[0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.01]) plt.figure(figsize=(20,6.5)) plt.title("电影主要类型分布图") plt.show() import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel("E:\\爬取\\爬取.xls") scores = data["排名"].values votes = data["评价人数"].values plt.rcParams["font.sans-serif"] = ["SimHei"] plt.scatter(scores, votes) plt.title("排名与评价人数散点图") plt.xlabel("排名") plt.ylabel("评价人数") plt.show()
这段代码主要是用来对爬取到的电影数据进行数据可视化的处理。在代码中使用了 pandas 库对 Excel 数据进行读取和处理,使用了 matplotlib 库来绘制各种图表。
第一个代码块绘制了电影年份的发展折线图,其中先对年份进行了分组统计,然后使用 plot 函数将结果绘制出来。
第二个代码块绘制了各个国家电影数量的柱状图,其中使用了 value_counts 函数对国家进行统计,然后使用 bar 函数将结果绘制出来。
第三个代码块绘制了电影主要类型分布的饼图,其中使用了 value_counts 函数对电影类型进行统计,然后使用 pie 函数将结果绘制出来。
第四个代码块绘制了排名与评价人数的散点图,其中使用了 scatter 函数将排名和评价人数进行散点绘制。
import pandas as pd ex = pd.read_excel('豆瓣音乐Top250.xls', index_col=0) ex.to_csv("豆瓣音乐Top250.csv", encoding="utf-8") import pandas as pda import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt mpl.rcParams['font.family'] = 'SimHei' mpl.rcParams['axes.unicode_minus'] = False mpl.rcParams['font.size'] = 15 df = pd.read_csv('豆瓣音乐Top250.csv') display(df)
这段代码使用了pandas库来读取Excel文件,并将其转换为CSV文件。首先,我们导入`pandas`库并给它取一个别名`pd`。然后,使用`pd.read_excel()`函数读取名为"豆瓣音乐Top250.xls"的Excel文件,并将其存储在名为`ex`的变量中,设置`index_col=0`表示使用第一列作为索引列。
接下来,使用`ex.to_csv()`函数将`ex`变量中的数据转换为CSV格式,并保存为名为"豆瓣音乐Top250.csv"的文件,设置`encoding="utf-8"`表示使用UTF-8编码保存。
然后,我们导入了其他需要的库,包括`numpy`、`matplotlib`等,并对matplotlib进行了一些配置,以便在绘图时能够正确显示中文字符。
最后,使用`pd.read_csv()`函数读取名为"豆瓣音乐Top250.csv"的CSV文件,并将其存储在名为`df`的变量中。最后一行代码`display(df)`用于显示数据框中的数据。
这段代码的目的是读取Excel文件并转换为CSV文件,并使用pandas和matplotlib库进行数据处理和可视化。
阅读全文