pandas 读取excel表格,将日期一列中2022年1月5日至2022年1月13日,“标记”列标记为特殊
时间: 2024-10-25 09:12:47 浏览: 35
要实现这个需求,首先我们需要读取Excel文件到Pandas DataFrame中,然后筛选出指定日期范围的数据,并在“标记”列中设置特殊标识。以下是步骤:
1. **读取Excel文件**[^1]:
使用`pandas.read_excel()`函数读取Excel文件,设置`index_col=None`以避免默认情况下作为索引的第一列被读入。
```python
df_read = pd.read_excel(r"C:\Users\radiomumm\Desktop\sucai\qpcr_clean.xlsx", index_col=None)
```
2. **筛选日期范围**:
使用条件布尔索引来选择日期在2022年1月5日至2022年1月13日之间的行。
```python
start_date = "2022年1月5日"
end_date = "2022年1月13日"
date_mask = (pd.to_datetime(df_read['日期']) >= start_date) & (pd.to_datetime(df_read['日期']) <= end_date)
df_filtered = df_read[date_mask]
```
3. **设置“标记”列**:
根据筛选结果,在“标记”列中添加特殊标识(假设我们用'default'表示不在范围内,'special'表示在范围内)。
```python
df_filtered['标记'] = np.where(date_mask, 'special', 'default')
```
4. **保存更新后的DataFrame**:
最后,我们可以将过滤并修改后的DataFrame保存回Excel文件,指定`index=False`来避免生成行数列。
```python
df_filtered.to_excel(r"C:\Users\radiomumm\Desktop\sucai\qpcr_filtered.xlsx", index=False)
```
阅读全文