python获取excel不同表格里的相同数据并输出
时间: 2023-08-15 19:06:17 浏览: 101
你可以使用Python中的pandas库来读取Excel文件中的数据,并使用merge()函数来合并不同的表格并筛选出相同的数据。具体实现步骤如下:
1. 首先导入pandas库并读取Excel文件中的表格数据:
```python
import pandas as pd
# 读取Excel文件
df1 = pd.read_excel('file.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('file.xlsx', sheet_name='Sheet2')
```
2. 使用merge()函数合并两个表格并筛选出相同的数据:
```python
# 合并两个表格,根据相同的列进行筛选
result = pd.merge(df1, df2, on='column_name', how='inner')
# 输出结果
print(result)
```
其中,`column_name`是需要筛选的相同列的名称,`how='inner'`表示只保留两个表格中都存在的数据。
通过以上步骤,你就可以获取Excel不同表格里的相同数据并输出了。
相关问题
python获取excel不同表中的相同数据
你可以使用Python中的pandas库来读取Excel文件中的数据,并使用merge()函数来合并不同的表格并筛选出相同的数据。具体实现步骤如下:
1. 首先导入pandas库并读取Excel文件中的表格数据:
```python
import pandas as pd
# 读取Excel文件中的两个表格数据
df1 = pd.read_excel('file.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('file.xlsx', sheet_name='Sheet2')
```
2. 使用merge()函数合并两个表格并筛选出相同的数据:
```python
# 合并两个表格,根据相同的列进行筛选
result = pd.merge(df1, df2, on='column_name', how='inner')
# 输出结果
print(result)
```
其中,`column_name`是需要筛选的相同列的名称,`how='inner'`表示只保留两个表格中都存在的数据。
通过以上步骤,你就可以获取Excel不同表格中的相同数据了。如果需要输出到新的Excel文件中,可以使用to_excel()函数,如下所示:
```python
# 输出结果到新的Excel文件中
result.to_excel('result.xlsx', index=False)
```
其中,`index=False`表示不需要输出行索引。
用python将一个excel表格中的数据生成一个字典然后用生成的字典去对比另一个excel表格中的数据找到相同的数据在输出一个新的excel表格
好的,我来解答你的问题。
首先,我们需要使用 `openpyxl` 模块来读取和写入 Excel 文件。你可以使用以下命令行安装这个模块:
```
pip install openpyxl
```
接下来,我们来看看如何将一个 Excel 表格中的数据生成一个字典。假设我们有一个名为 `data.xlsx` 的 Excel 文件,其中包含以下数据:
| 姓名 | 年龄 | 性别 |
| --- | --- | --- |
| 小明 | 20 | 男 |
| 小红 | 18 | 女 |
| 小刚 | 22 | 男 |
| 小美 | 19 | 女 |
我们可以使用以下 Python 代码将这些数据读取到一个字典中:
```python
from openpyxl import load_workbook
wb = load_workbook('data.xlsx')
ws = wb.active
data = {}
for row in ws.iter_rows(min_row=2, values_only=True):
name, age, gender = row
data[name] = {'age': age, 'gender': gender}
```
上面的代码中,我们首先使用 `load_workbook` 函数加载 Excel 文件。然后,我们使用 `active` 属性获取当前活动的工作表。接着,我们使用 `iter_rows` 方法遍历工作表中的每一行数据。由于第一行是标题,我们使用 `min_row=2` 参数跳过第一行。然后,我们使用 `values_only=True` 参数获取每一行的值,而不是单元格对象。最后,我们将每一行的数据存储到一个以姓名为键的字典中。
接下来,我们需要读取另一个 Excel 文件,并找到与第一个文件中相同的数据。假设我们有一个名为 `other.xlsx` 的 Excel 文件,其中包含以下数据:
| 姓名 | 地址 |
| --- | --- |
| 小明 | 北京市 |
| 小红 | 上海市 |
| 小刚 | 广州市 |
| 小丽 | 深圳市 |
我们可以使用以下 Python 代码将这些数据读取到一个新的字典中,并查找与第一个文件中相同的数据:
```python
other = {}
for row in ws.iter_rows(min_row=2, values_only=True):
name, address = row
other[name] = address
result = {}
for name, info in data.items():
if name in other:
result[name] = {'age': info['age'], 'gender': info['gender'], 'address': other[name]}
```
上面的代码中,我们首先使用 `iter_rows` 方法遍历另一个 Excel 文件中的每一行数据,并将其存储到一个以姓名为键的字典中。然后,我们遍历第一个 Excel 文件中的每一行数据。如果当前行的姓名在第二个文件中也存在,我们就将该行数据和第二个文件中对应的地址存储到一个新的字典中。
最后,我们需要将这个新的字典写入到一个 Excel 文件中。我们可以使用以下 Python 代码实现:
```python
from openpyxl import Workbook
wb = Workbook()
ws = wb.active
ws.append(['姓名', '年龄', '性别', '地址'])
for name, info in result.items():
ws.append([name, info['age'], info['gender'], info['address']])
wb.save('result.xlsx')
```
上面的代码中,我们首先创建一个新的 Excel 文件,并获取当前活动的工作表。然后,我们使用 `append` 方法将标题行写入工作表。接着,我们遍历新的字典中的每一行数据,将其写入到工作表中。最后,我们使用 `save` 方法将工作表保存到一个名为 `result.xlsx` 的文件中。
希望这样的回答对你有所帮助!
阅读全文