python用pandas读取csv文件,将评论时间内同一年评论选择出来,再根据月份 ,将其评分选择出来,画散点图
时间: 2023-10-25 16:08:51 浏览: 77
可以按照以下步骤来实现:
1. 使用 pandas 库读取 csv 文件,将其转化为 DataFrame 格式。假设文件名为 data.csv,可以使用以下代码读取:
```python
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 将评论时间转化为 datetime 类型,并提取出年份和月份。这可以使用 pandas 的 to_datetime() 函数和 dt 属性来实现:
```python
df['comment_time'] = pd.to_datetime(df['comment_time'])
df['year'] = df['comment_time'].dt.year
df['month'] = df['comment_time'].dt.month
```
3. 根据年份筛选出同一年的评论:
```python
year_filter = df['year'] == 2022 # 选择 2022 年的评论
df_year = df[year_filter]
```
4. 根据月份和评分选择数据,并绘制散点图。这可以使用 matplotlib 库来实现:
```python
import matplotlib.pyplot as plt
month_filter = df_year['month'] == 1 # 选择 1 月的评论
score = df_year.loc[month_filter, 'score'] # 选择评分列
plt.scatter(range(len(score)), score) # 绘制散点图
plt.show()
```
可以根据需要修改月份和评分的数值,以及绘制散点图的样式。
阅读全文