表格匹配字符串是否存在另一个表格,用python
时间: 2024-03-19 17:16:22 浏览: 78
可以使用Python中的pandas库来实现表格匹配字符串是否存在另一个表格。具体步骤如下:
1. 首先导入pandas库:
```python
import pandas as pd
```
2. 读取需要匹配的两个表格数据:
```python
df1 = pd.read_excel('table1.xlsx') # 第一个表格
df2 = pd.read_excel('table2.xlsx') # 第二个表格
```
3. 对于每个单元格,提取出字符串并判断是否在另一个表格中存在,将结果存储在一个新列中:
```python
df1['Exist in df2'] = df1.apply(lambda row: any(row['Column1'] in s for s in df2['Column2']), axis=1)
```
其中,`Column1`是第一个表格中需要进行匹配的列名,`Column2`是第二个表格中需要进行匹配的列名。
4. 将结果保存到一个新表格中:
```python
df1.to_excel('result.xlsx', index=False)
```
完整代码示例:
```python
import pandas as pd
df1 = pd.read_excel('table1.xlsx') # 第一个表格
df2 = pd.read_excel('table2.xlsx') # 第二个表格
df1['Exist in df2'] = df1.apply(lambda row: any(row['Column1'] in s for s in df2['Column2']), axis=1)
df1.to_excel('result.xlsx', index=False)
```
需要注意的是,上述代码中的`Column1`和`Column2`需要替换成实际的列名。另外,如果表格数据量比较大,上述代码可能会比较耗时,可以考虑使用多线程或分批处理来提高效率。
阅读全文