python实现从txt文件中读取内容,遇到带/n的数字组合就去掉此数字,并将处理后的结果每四个一列导入excel
时间: 2024-09-21 16:06:37 浏览: 39
在Python中,你可以使用`pandas`库来轻松地完成这个任务。首先,你需要读取txt文件的内容,然后使用正则表达式替换包含`\n`的数字,最后将处理后的数据写入Excel文件。以下是一个步骤说明:
1. **安装所需库** (如果尚未安装):
```shell
pip install pandas openpyxl
```
2. **读取txt文件并处理内容**:
```python
import re
import pandas as pd
def remove_newline_numbers(line):
# 使用正则表达式查找并替换带'\n'的数字
return re.sub(r'\d+\n', '', line)
# 读取txt文件
with open('input.txt', 'r') as file:
lines = file.readlines()
# 对每一行应用处理函数
processed_lines = [remove_newline_numbers(line) for line in lines]
# 将处理后的数据转换成DataFrame
data = pd.DataFrame(processed_lines, columns=['Column']) # 假设只有一个列
```
3. **写入Excel文件**:
```python
# 每4个元素一组,使用pandas的rolling函数生成子集
grouped_data = data.rolling(4).apply(lambda x: x.values.tolist(), raw=True)
# 写入Excel
grouped_data.to_excel('output.xlsx', index=False, header=False)
```
这会创建一个新的Excel文件,其中的数据每四行是一个列表,每个列表对应txt文件中原始的一组连续文本。
阅读全文