现在我有2010年-2023年的 高校申请专利数据,以5年为一组,每分一组,新建一个excel表。如,2010-2014看作2014年,请写出相关代码
时间: 2024-09-12 10:08:41 浏览: 39
HTML新年快乐2023源代码,兔年新年红包代码
5星 · 资源好评率100%
根据您的需求,我将提供一个示例代码,假设您使用的是Python语言,并且利用了pandas库来进行数据处理。这个代码段会读取包含专利数据的Excel文件,然后按您要求的5年一组的方式创建新的Excel表。
首先,确保安装了pandas和openpyxl库(用于读写Excel文件):
```bash
pip install pandas openpyxl
```
然后,您可以使用以下Python代码:
```python
import pandas as pd
# 读取原始的Excel文件
df = pd.read_excel('原始专利数据.xlsx')
# 创建一个空字典来存储新的Excel工作表数据
data_frames = {}
# 按照5年一组的方式处理数据
for year in range(2010, 2024, 5):
# 选择数据范围
start_year = year
end_year = year + 4
filtered_data = df[(df['申请年份'] >= start_year) & (df['申请年份'] <= end_year)]
# 将处理后的数据存储在字典中,键名为结束年份
data_frames[f'{end_year}年'] = filtered_data
# 创建新的Excel文件,并为每个5年周期写入一个工作表
with pd.ExcelWriter('分组专利数据.xlsx') as writer:
for sheet_name, data in data_frames.items():
data.to_excel(writer, sheet_name=sheet_name, index=False)
print('分组后的Excel文件创建完成。')
```
这段代码做了以下几步操作:
1. 导入pandas库。
2. 读取名为`原始专利数据.xlsx`的Excel文件到DataFrame中。
3. 使用一个循环,按照5年为一组的方式筛选数据,并将其存储在一个字典中。
4. 使用`ExcelWriter`将每个组的数据写入到名为`分组专利数据.xlsx`的新Excel文件中,每个组作为一个新的工作表。
请确保您的原始数据中有一个叫做“申请年份”的列,用于筛选对应年份的数据。如果列名不同,请相应地修改代码中的列名。
阅读全文