python批量提取txt的某几列
时间: 2023-08-16 17:42:48 浏览: 187
可以使用Python的`pandas`库来处理这个需求。具体步骤如下:
1. 打开txt文件,将文件中的数据读取到一个`DataFrame`中。
```python
import pandas as pd
# 打开txt文件,将文件中的数据读取到DataFrame中
with open('data.txt', 'r') as f:
data = []
for line in f.readlines():
data.append(line.strip().split('\t'))
df = pd.DataFrame(data)
```
2. 删除不需要的列,只保留需要的列。
```python
# 删除不需要的列,只保留需要的列
df = df.iloc[:, [0, 2, 4]]
```
其中,`df.iloc[:, [0, 2, 4]]`表示保留第1、3、5列。
3. 将处理后的数据保存到新的文件中。
```python
# 将处理后的数据保存到新的文件中
df.to_csv('new_data.txt', sep='\t', index=False, header=False)
```
其中,`sep='\t'`表示使用制表符作为列分隔符,`index=False`表示不保存行索引,`header=False`表示不保存列名。
完整代码如下:
```python
import pandas as pd
# 打开txt文件,将文件中的数据读取到DataFrame中
with open('data.txt', 'r') as f:
data = []
for line in f.readlines():
data.append(line.strip().split('\t'))
df = pd.DataFrame(data)
# 删除不需要的列,只保留需要的列
df = df.iloc[:, [0, 2, 4]]
# 将处理后的数据保存到新的文件中
df.to_csv('new_data.txt', sep='\t', index=False, header=False)
```
请根据实际情况修改文件名、列索引等参数。
阅读全文