现在我有2010年-2023年的 高校申请专利数据,以5年为一组,每分一组,新建一个excel表。如,2010-2014看作2014年,依次写出10年循环,请写出相关代码
时间: 2024-09-12 11:08:45 浏览: 42
2023年更新的最新版全国五级行政区域数据库表以及sql文件
为了完成这个任务,我们可以使用Python编程语言和pandas库来处理数据。以下是一个简单的Python脚本,用于读取数据、分组并创建新的Excel工作表。假设你的数据是以CSV格式存储,其中包含一个日期字段,我们可以将其命名为“year”。
请确保你已经安装了pandas和openpyxl库,因为我们将使用openpyxl来写入Excel文件。如果你还没有安装这些库,可以使用pip命令安装:
```bash
pip install pandas openpyxl
```
以下是完成任务的Python代码示例:
```python
import pandas as pd
from openpyxl import Workbook
# 读取CSV文件
df = pd.read_csv('path_to_your_csv_file.csv')
# 假设CSV文件中有一个名为'year'的列,表示申请专利的年份
# 定义一个函数将年份分组
def group_years(year):
return str(year - year % 5) + '-' + str(year - year % 5 + 4)
# 应用函数进行分组
df['grouped_year'] = df['year'].apply(group_years)
# 创建Excel工作簿
wb = Workbook()
# 按分组创建工作表并填充数据
for year_group, group_df in df.groupby('grouped_year'):
ws = wb.create_sheet(title=year_group)
# 将分组后的数据写入对应的工作表
group_df.to_excel(ws, index=False)
# 保存工作簿到文件
wb.save('grouped_patents.xlsx')
# 打印完成信息
print("分组完成并保存至 'grouped_patents.xlsx'")
```
请将`path_to_your_csv_file.csv`替换为你的CSV文件的实际路径。此代码将创建一个名为`grouped_patents.xlsx`的Excel文件,其中包含了按5年分组的数据。
阅读全文