Python读取TXT文件清洗后生成新的TXT文件 代码
时间: 2024-10-11 08:17:29 浏览: 14
Python中读取TXT文件并清洗数据然后生成新的TXT文件通常会涉及以下几个步骤:
1. **打开文件**:使用内置模块`open()`打开文本文件,可以指定模式如'r'(读取)或'a'(追加),这里我们假设是读取模式。
```python
with open('input.txt', 'r') as file:
```
2. **读取内容**:使用`file.read()`读取文件全部内容,或`file.readline()`逐行读取。
```python
content = file.read() # 或者
lines = file.readlines()
```
3. **数据清洗**:根据需要对读取的内容进行处理,比如去除空格、换行符,替换特定字符等。可以使用字符串方法或正则表达式。
```python
cleaned_content = content.strip() # 去除首尾空白
# 或者使用正则表达式
import re
cleaned_content = re.sub(r'\s+', '', content) # 清理所有连续空格
```
4. **写入新文件**:将清洗后的数据写入到新的TXT文件中,同样使用`open()`函数以'w'(写入)模式。
```python
with open('output.txt', 'w') as output_file:
output_file.write(cleaned_content)
```
5. **关闭文件**:记得在操作完成后关闭文件,尽管在`with`语句中这已经自动完成,但如果不在`with`块内,还需要添加`file.close()`。
完整代码示例:
```python
with open('input.txt', 'r') as file_in, open('output.txt', 'w') as file_out:
lines = file_in.readlines()
cleaned_lines = [line.strip() for line in lines] # 使用列表推导式清理每一行
file_out.writelines(cleaned_lines)
```
阅读全文