如何用pandas库从没有表头列名的csv文件中根据其第5第6列与txt文件中第6第7列具有各自相同数据的条件筛选出包含第5第6行在内的行数
时间: 2024-02-17 22:03:53 浏览: 57
使用pandas库对csv文件进行筛选保存
5星 · 资源好评率100%
可以使用pandas库中的read_csv函数读入csv文件,然后使用header参数指定表头为None,再使用usecols参数指定需要读入的列为第5列和第6列,代码如下:
```python
import pandas as pd
df = pd.read_csv('filename.csv', header=None, usecols=[4, 5])
```
接下来,使用pandas库中的read_table函数读入txt文件,再使用usecols参数指定需要读入的列为第6列和第7列,代码如下:
```python
txt_df = pd.read_table('filename.txt', header=None, usecols=[5, 6])
```
然后,使用merge函数将两个DataFrame按照第6列进行合并,代码如下:
```python
result_df = pd.merge(df, txt_df, on=5)
```
最后,筛选出第5列和第6列同时满足条件的行数,代码如下:
```python
filtered_df = result_df[(result_df[4] == result_df[5])]
rows = filtered_df.index.tolist()
```
其中,rows即为包含第5列和第6列同时满足条件的行数的列表。
阅读全文