python读txt拆分
时间: 2025-01-03 11:11:31 浏览: 6
### 使用 Python 读取 TXT 文件并按行或指定规则拆分内容
#### 按行读取文件并将每一行作为单独的内容处理
为了实现这一目标,可以打开指定路径下的 `.txt` 文件,并逐行读取其内容。对于每一行的数据可以根据需求进一步加工处理。
```python
with open('D:/yyy/Desktop/val.txt', 'r', encoding='utf-8') as file:
lines = file.readlines()
for line in lines:
processed_line = line.strip() # 去除首尾空白字符包括换行符
print(processed_line)
```
此段代码展示了如何通过 `open()` 函数以只读模式 (`'r'`) 和 UTF-8 编码方式来访问文本文件[^1]。接着使用 `readlines()` 方法获取整个文档的所有行作为一个列表返回给变量 `lines` 。最后遍历这个列表并对每一项执行字符串修剪操作以便后续可能的操作如创建新文件名等。
#### 根据特定分隔符解析每行数据
当面对结构化的纯文本记录时——比如 CSV 风格的条目之间由逗号或其他符号区分开来的场合下,则可借助于内置模块 `csv` 或者简单的字符串方法来进行切割工作。
```python
delimiter = ',' # 定义分隔符为逗号
with open('example.csv', 'r', encoding='utf-8') as csvfile:
reader = csv.reader(csvfile, delimiter=delimiter)
for row in reader:
print(row) # 输出被分割后的字段组成的列表
```
这里展示了一个更通用的方法用于按照自定义定界符分离各行中的各个组成部分[^2]。注意,在实际应用中应当依据具体场景调整输入源以及所使用的分隔标记;上述例子假设了 CSV 类型的数据集并且采用了标准库里的 `csv.reader` 来简化流程。
#### 将拆分的结果保存到新的文本文件里
如果目的是不仅仅读取和分析现有资料,还需要把经过变换之后的信息存储下来形成全新的档案的话,那么就需要考虑怎样高效而正确地写出这些修改过的新片段至磁盘上去了。
```python
output_filename = "splitted_data.txt"
with open(output_filename, 'w', newline='', encoding='utf-8') as outfile:
writer = csv.writer(outfile, quoting=csv.QUOTE_MINIMAL)
with open('source_file.txt', 'r', encoding='utf-8') as infile:
content = infile.read().split('\n')
for item in content:
parts = item.split(',')
cleaned_parts = [part.strip() for part in parts]
writer.writerow(cleaned_parts)
```
这段脚本说明了怎样先加载原始素材再对其进行必要的清理(例如去掉多余的空格),随后将整理完毕的小节依次追加进目的位置处的一个全新 .txt 文档之中[^3]。值得注意的是,此处还引入了 `newline=''` 参数防止 Windows 平台上可能出现额外回车现象影响最终输出质量。
阅读全文