pandas将一张excel表筛选为新表
时间: 2023-11-27 20:59:10 浏览: 35
可以使用pandas中的read_excel()方法读取Excel文件,并使用DataFrame进行数据筛选,最后使用to_excel()方法将筛选后的数据保存为新的Excel表格。以下是一个示例代码:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('filename.xlsx')
# 筛选数据
new_df = df[df['column_name'] > 10]
# 将筛选后的数据保存为新的Excel文件
new_df.to_excel('new_filename.xlsx', index=False)
```
其中,'filename.xlsx'是原始Excel文件名,'column_name'是要筛选的列名,'> 10'是筛选条件。保存的新Excel文件名为'new_filename.xlsx'。需要注意的是,to_excel()方法的index参数默认为True,如果不想保存行索引,需要将其设为False。
相关问题
Python实现,对某个excel表进行id筛选,筛选的id来自另外一张excel表
假设你有两个Excel文件:文件A和文件B,文件A中有一个id字段,文件B中也有一个id字段。你想要从文件A中筛选出来所有在文件B中存在的id。
你可以使用如下的Python代码来实现:
```python
import pandas as pd
# 读取文件A和文件B
df_a = pd.read_excel('file_a.xlsx')
df_b = pd.read_excel('file_b.xlsx')
# 从文件B中获取所有的id
id_list = df_b['id'].tolist()
# 根据从文件B中获取的id,在文件A中进行筛选
result = df_a[df_a['id'].isin(id_list)]
# 打印筛选结果
print(result)
```
在这个例子中,我们使用了pandas库来读取Excel文件,并使用了`df.isin()`方法来对id进行筛选。注意,这里默认使用第一张工作表(Sheet1),如果你的Excel文件有多张工作表,你需要指定具体的工作表名或索引。
同时,如果你的Excel文件非常大,可能会出现内存不足的问题。这时你可以考虑分块读取Excel文件,或者使用专门的库来处理大型Excel文件。
pycharm pandas excel 保留指定列等于特定几个值的行数并保存为另一张表格
你可以使用以下代码来保留指定列等于特定值的行,并将结果保存为另一张Excel表格:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('input.xlsx')
# 保留指定列等于特定值的行
df_filtered = df[df['column_name'].isin(['value_1', 'value_2'])]
# 将结果保存为Excel文件
df_filtered.to_excel('output.xlsx', index=False)
```
在上面的代码中,你需要将 `column_name` 替换为你要筛选的列的名称,并将 `value_1` 和 `value_2` 替换为你要保留的特定值。最后,将 `input.xlsx` 替换为你的输入文件名,将 `output.xlsx` 替换为你要保存的输出文件名。