import pandas as pd import matplotlib.pyplot as plot raw_data = pd.read_csv(r'/Users/wangruihan/Desktop/time_series_covid19_confirmed_global.csv',na_values='?') #设定'?'为缺失值 #查看有哪些列 print(raw_data.columns) #查看前几行数据 print(raw_data[:10]) #检查含有缺失值的列 print(raw_data.isnull().any() ) print(raw_data.shape) #缺失值处理 print(raw_data[raw_data.isnull().values==True]) fill_na = lambda col:col.fillna('not know')#定义fill_na函数,用'not know'字符串填充缺失值 fill_data = raw_data.apply(fill_na, axis=0) #将填充后的数据赋给fill_data print(fill_data.isnull().any()) #检查是否填充成功 isDuplicated=fill_data.duplicated() #判断重复数据记录 print(isDuplicated) #初步了解数据构成 print(fill_data[fill_data['Country/Region']=='China']) data = fill_data.drop(['Province/State','Lat','Long'],axis=1) #删除属性列 data = data.groupby('Country/Region').sum() # 按Country/Region并求和 print(data.index.values) #列出全部可索引的Country/Region名称 data_us = data[data.index.isin(['US','China','United Kingdom','Italy','Germany','France'])] print(data_us) data_us.T.plot(figsize=(15,7)) #数据趋势图 最后数据趋势图不显示怎么办
时间: 2024-02-11 18:07:13 浏览: 93
如果你在Jupyter Notebook中运行这段代码并且没有看到数据趋势图,则可以在代码的最后加上`plt.show()`命令,如下所示:
```
data_us.T.plot(figsize=(15,7))
plt.show()
```
这个命令将显示图表并将其添加到Jupyter Notebook中。请注意,你需要首先导入matplotlib库,使用`import matplotlib.pyplot as plt`命令。
相关问题
import pandas as pd import numpy as np import matplotlib.pyplot as plt def draw_plot(list): plt.plot(list['director_name'],list['movie_facebook_likes']) plt.show() if __name__ == "__main__": data = pd.read_csv('../data/movie.csv') data['director_name'].describe() plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams["axes.unicode_minus"] = False draw_plot(data) print(data)
这段代码是用 Pandas 和 Matplotlib 读取并绘制电影数据集中导演名字与电影 Facebook 点赞数的关系图。其中主要的函数有:
- `pd.read_csv()`:读取 CSV 文件内容为 Pandas 数据帧。
- `data['director_name'].describe()`:输出导演名字的统计信息。
- `plt.rcParams["font.sans-serif"] = ["SimHei"]`:设置字体为中文。
- `plt.rcParams["axes.unicode_minus"] = False`:解决负号显示为方块的问题。
- `draw_plot()`:绘制关系图,横轴为导演名字,纵轴为电影 Facebook 点赞数。
- `plt.show()`:展示绘制的关系图。
需要注意的是,`draw_plot()` 函数的参数应该为 Pandas 数据帧而非路径。因此,主函数中应该改为 `draw_plot(data)` 而不是 `draw_plot('../data/movie.csv')`。
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline uniqlo = pd.read_csv(r'c:\users\李响\Desktop\unique.csv') uniqlo . describe()
这段代码使用了Python中的Pandas、Matplotlib和Seaborn库,首先通过读取本地的一个名为unique.csv的文件,将数据读入到变量uniqlo中。然后使用describe()方法对数据进行描述性统计分析,例如计算均值、中位数、标准差、最小值和最大值等。最后将分析结果通过Matplotlib和Seaborn可视化库进行可视化展示。
其中,Pandas是Python中用于数据分析的重要库,可以方便地读取和处理各种类型的数据。Matplotlib是Python中用于绘制图形的库,可以实现各种类型的可视化展示。Seaborn是基于Matplotlib的高级可视化库,提供了更加美观、易用和丰富的图形展示功能。%matplotlib inline是Jupyter Notebook中的魔法命令,用于在Notebook中显示Matplotlib绘制的图形。
阅读全文