现在我有2010年-2023年的 高校申请专利数据,以5年为一组,每分一组,新建一个excel表。如,2010-2014看作2014年,依次以2014、2015、2016、2017、2018、2019、2020、2021、2022、2023这十年循环。请写出相关代码
时间: 2024-09-12 21:08:41 浏览: 27
2023年更新的最新版全国五级行政区域数据库表以及sql文件
为了完成您的要求,可以使用Python中的pandas库来处理Excel数据。以下是一个简单的Python脚本示例,它可以读取Excel数据,然后根据您提供的规则进行处理,并将每五年一组的数据保存到新的Excel表中。
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('path_to_your_excel_file.xlsx') # 替换为您的文件路径
# 创建一个新的DataFrame,用于存储处理后的数据
processed_data = pd.DataFrame()
# 遍历数据,按照每五年一组进行处理
for year in range(2010, 2024, 5):
# 定义起始年和结束年
start_year = year
end_year = year + 4
# 筛选出对应年份的数据
filtered_df = df[(df['Year'] >= start_year) & (df['Year'] <= end_year)]
# 为新表创建一个年份列
filtered_df['Year'] = year
# 将处理后的数据添加到processed_data DataFrame中
processed_data = pd.concat([processed_data, filtered_df])
# 将处理后的数据保存为新的Excel文件
processed_data.to_excel('output_excel_file.xlsx', index=False) # 替换为您想要的输出文件路径
```
请注意,这个代码段假设您的原始Excel文件中有一个名为'Year'的列,其中包含年份信息。您需要根据实际情况调整代码,比如文件路径、列名等。
在运行这段代码之前,请确保您的Python环境中已经安装了pandas库和openpyxl库(用于读写Excel文件)。如果没有安装,可以通过以下命令安装:
```bash
pip install pandas openpyxl
```
阅读全文