现在我有2010年-2023年的 高校申请专利数据,以5年为一组,每分一组,新建一个excel表。如,2010-2014看作2014年,请写出以2014、2015、2016、2017、2018、2019、2020、2021、2022、2023为中止年的相关代码
时间: 2024-09-12 16:08:47 浏览: 35
要实现您所需的功能,您可以使用Python中的pandas库来处理数据和创建Excel文件。以下是一个简单的代码示例,它将指导您如何根据年份范围分组数据,并将每组数据保存到不同的Excel工作表中。假设您的数据已经以某种方式加载到名为`df`的pandas DataFrame中。
```python
import pandas as pd
# 假设df是包含所有年份数据的DataFrame,且包含一个名为'year'的列,其中存储了申请专利的年份信息。
# 创建一个Excel写入器对象
with pd.ExcelWriter('university_patent_data.xlsx') as writer:
# 定义年份范围的列表
year_ranges = [(2010, 2014), (2015, 2019), (2020, 2023)]
# 遍历年份范围,创建相应的数据子集并写入Excel
for i, (start_year, end_year) in enumerate(year_ranges):
# 选择对应年份范围的数据
df_subset = df[(df['year'] >= start_year) & (df['year'] <= end_year)]
# 将年份转换为字符串,用于创建工作表名
sheet_name = f"{start_year}-{end_year}"
# 将数据子集写入新的Excel工作表,对应年份范围的名字
df_subset.to_excel(writer, sheet_name=sheet_name, index=False)
# 上述代码将在当前工作目录创建名为'university_patent_data.xlsx'的Excel文件,包含三个工作表:
# 2010-2014, 2015-2019, 2020-2023。
```
确保您的环境中已经安装了pandas库和openpyxl库(用于写入Excel文件)。您可以使用以下命令来安装这些库(如果尚未安装的话):
```shell
pip install pandas openpyxl
```
请根据您的实际数据结构调整代码中的DataFrame列名和操作。
阅读全文