file = '新建文本文档.txt' with open(file,encoding='utf-8') as f: lines = f.readlines() print('lines为：',lines) split_list = [] for s in lines: s = s.strip() # 删除字符串两端的空格和换行符 #print('s为',s) split_list.append(s.split(':', 1)) # 用第一个冒号分割字符串，最多分割一次 first_list = [s[0] for s in split_list] second_list = [s[1] for s in split_list] new_second_list=[] print(first_list) print(second_list) for i in second_list: i = i.strip() # 删除字符串两端的空格和换行符 new_second_list.append(i) print(new_second_list) #转化为列表 dict = dict(zip(first_list,new_second_list)) print(dict) a = [] # SrcDatabase-来源库 b = [] # Title-题名 c = [] # Author-作者 d = [] # Organ-单位 e = [] # Source-文献来源 f = [] # PubTime-发表时间 g = [] # Volume-卷 h = [] # Period-期 for key,value in dict.items(): if 'SrcDatabase-来源库' in dict[key]: a.append(dict[value]) elif 'Title-题名' in dict[key]: b.append(dict[value]) elif 'Author-作者' in dict[key]: c.append(dict[value]) elif 'Organ-单位' in dict[key]: d.append(dict[value]) elif 'Source-文献来源' in dict[key]: e.append(dict[value]) elif 'PubTime-发表时间' in dict[key]: f.append(dict[value]) elif 'Volume-卷' in dict[key]: g.append(dict[value]) else: h.append(dict[value]) print('SrcDatabase-来源库:',a) print('Title-题名:',b) print('Author-作者:',c) print('Organ-单位:',d) print('Source-文献来源:',e) print('PubTime-发表时间',f) print('Volume-卷:',g) print('Period-期:',h) df = pd.DataFrame({"SrcDatabase-来源库":a,"Title-题名": b,"Author-作者":c,"Organ-单位": d,"Source-文献来源":e,"PubTime-发表时间": f,"Volume-卷":g,"Period-期": h}) df.to_excel("处理后的文档.xlsx", index=False)有问题吗，这个代码，如有，怎么解决

时间: 2023-06-06 19:05:40 浏览: 117

使用文件流操作文本文件.docx

使用文件流操作文本文件使用文件流操作文本文件是编程中的基础任务之一，它涉及打开文件、读取或写入数据、以及关闭文件等步骤。在Python中，文件操作通常使用内置的open()函数来实现，该函数返回一个文件对象，该对象具有用于读写文件的各种方法。以下是对使用文件流操作文本文件的详细介绍，旨在达到约2000字的篇幅。一、引言文件是数据存储的重要形式，它可以长期保存数据并供以后使用。在Python中，文件操作是编程中不可或缺的一部分。文件流是一种抽象的概念，它表示数据在内存和外部存储设备（如硬盘）之间传输的通道。在文件操作中，我们通常将文件视为一个流，通过文件对象提供的各种方法来读取或写入数据。二、文件操作的基本概念在Python中，文件操作主要涉及以下几个概念：文件路径：文件在存储系统中的位置，通常由目录和文件名组成。文件模式：打开文件时所使用的模式，如只读、只写、读写等。文件对象：通过open()函数打开文件后返回的对象，它包含了用于读写文件的各种方法。文件指针：一个抽象的概念，用于标识当前读写操作在文件中的位置。三、文件操作的步 ### 使用文件流操作文本文件 #### 一、引言文件是数据存储的重要形式，能够长期保存数据并供以后使用。在 Python 中，文件操作是编程中不可或缺的一部分。文件流是一种抽象的概念，它表示数据在内存和外部存储设备（如硬盘）之间传输的通道。在文件操作中，我们将文件视为一个流，通过文件对象提供的各种方法来读取或写入数据。 #### 二、文件操作的基本概念在 Python 中，文件操作主要涉及以下几个概念： 1. **文件路径**：文件在存储系统中的位置，通常由目录和文件名组成。 2. **文件模式**：打开文件时所使用的模式，如只读 (`r`)、只写 (`w`)、读写 (`r+` 或 `w+`) 等。 3. **文件对象**：通过 `open()` 函数打开文件后返回的对象，它包含了用于读写文件的各种方法。 4. **文件指针**：一个抽象的概念，用于标识当前读写操作在文件中的位置。 #### 三、文件操作的步骤 1. **打开文件** - 使用 `open()` 函数打开文件，并指定文件路径和模式。`open()` 函数返回一个文件对象，用于后续的文件操作。 - 示例代码： ```python # 以只读模式打开文件 file = open('example.txt', 'r') ``` - 在上面的代码中，`'example.txt'` 是文件的路径和名称，`'r'` 表示以只读模式打开文件。如果文件不存在或无法打开，`open()` 函数将抛出一个 `FileNotFoundError` 或 `IOError` 异常。 2. **读取文件内容** - 使用文件对象的 `read()` 方法读取文件内容。`read()` 方法可以根据需要读取整个文件或指定数量的字节。 - 示例代码： ```python # 读取整个文件内容 content = file.read() print(content) # 读取指定数量的字节 content = file.read(10) # 读取前 10 个字节 print(content) ``` - 需要注意的是，在第一次调用 `read()` 之后，文件指针会移动到文件的末尾，因此第二次调用 `read()` 将不会读取到任何内容（除非文件非常大，以至于第一次调用没有读取完整个文件）。 3. **写入文件内容** - 使用文件对象的 `write()` 方法向文件中写入数据。需要注意的是，在写入数据之前，必须以写模式或追加模式打开文件。 - 示例代码： ```python # 以写模式打开文件（会覆盖原有内容） file = open('example.txt', 'w') file.write('Hello, world!\n') # 以追加模式打开文件（在原有内容后添加新内容） file = open('example.txt', 'a') file.write('This is a new line.\n') ``` - 在上面的代码中，第一个 `open()` 调用以写模式打开文件，并使用 `write()` 方法向文件中写入了一行文本。由于是以写模式打开文件，因此如果文件已经存在，它的内容将被覆盖。第二个 `open()` 调用以追加模式打开文件，并在原有内容后添加了一行新文本。 4. **关闭文件** - 在完成文件操作后，必须关闭文件以释放资源。这可以通过调用文件对象的 `close()` 方法来实现。 - 示例代码： ```python file.close() ``` - 虽然直接调用 `close()` 方法可以关闭文件，但更好的做法是使用 `with` 语句来自动管理文件的打开和关闭过程。`with` 语句可以确保在代码块执行完毕后自动关闭文件，即使发生异常也不会遗漏关闭操作。 - 示例代码： ```python with open('example.txt', 'r') as file: content = file.read() print(content) # 在这里，文件已经被自动关闭，无需再调用 close()方法 ``` #### 四、文件操作的高级话题 1. **文件路径和文件名处理** - 在实际应用中，可能需要处理不同路径和格式的文件名。Python 提供了 `os` 和 `pathlib` 等模块来处理文件路径和文件名。这些模块提供了许多有用的函数和方法，如拼接路径、拆分路径、判断文件是否存在等。 ```python import os from pathlib import Path # 获取当前工作目录 current_dir = os.getcwd() # 拼接路径 file_path = os.path.join(current_dir, 'subdir', 'example.txt') # 使用 pathlib path_obj = Path('subdir/example.txt') parent_dir = path_obj.parent file_name = path_obj.name ``` 2. **编码问题** - 在读取或写入文本文件时，可能会遇到编码问题。不同的操作系统默认使用的字符编码可能不同。例如，Windows 默认使用 `cp1252` 编码，而 Unix/Linux 系统默认使用 `UTF-8` 编码。 - 在 Python 中，可以通过指定 `open()` 函数的 `encoding` 参数来解决编码问题。 ```python # 以 UTF-8 编码读取文件 with open('example.txt', 'r', encoding='utf-8') as file: content = file.read() print(content) ``` 3. **文件读写的其他方法** - 除了 `read()` 和 `write()` 方法之外，文件对象还提供了多种其他方法来处理文件数据。 - `readline()`：每次读取一行数据。 ```python with open('example.txt', 'r', encoding='utf-8') as file: line = file.readline() while line: print(line.strip()) # 去除行尾换行符 line = file.readline() ``` - `readlines()`：一次性读取所有行，返回一个列表。 ```python with open('example.txt', 'r', encoding='utf-8') as file: lines = file.readlines() for line in lines: print(line.strip()) ``` - `seek()`：设置文件指针的位置。 ```python with open('example.txt', 'r', encoding='utf-8') as file: file.seek(10) # 将文件指针移动到第 10 个字符处 content = file.read() print(content) ``` 通过以上内容，我们可以看到 Python 中文件操作的灵活性和强大功能。掌握了这些基本概念和方法，便可以在实际编程中高效地处理文件读写需求。无论是简单的数据读取还是复杂的文件处理任务，Python 都能提供合适的工具和方法来满足需求。

这段代码的作用是打开一个名为'新建文本文档.txt'的文件，并以utf-8的编码方式读取文件中的所有行，存储在一个列表变量lines中。接着对lines中每一个字符串进行去除空白符的操作（strip()函数），并把去除空白符后的字符串存储在一个新的列表变量split_list中。

阅读全文

相关推荐

测量程序编制 - python B2文件-readline().pptx

完整版读文本文件(一行行的加入到列表框).e.rar

def cut_word(file_path): with open(file_path,'r',encoding='utf-8') as file: lines=file.readlines()这段有错误吗

booktype_id = input("请输入图书类别编号:") with open("booktype.csv", mode="a", encoding="utf-8", newline='') as file:补全代码实现将图书类别信息从文件（booktype.csv）中删除

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 8: invalid start byte

python基础之②txt文本读取和写入

python根据txt文本批量创建文件夹

最新推荐

基于微信小程序的校园论坛；微信小程序；云开发；云数据库；云储存；云函数；纯JS无后台；全部资料+详细文档+高分项目.zip

单电阻采样 基于单电阻采样的相电流重构算法 keil完整工程 单电阻采样 f103的单电阻，完整工程，带文档，带硬件资料 f3平台的单电阻完整工程，代码详细注释 还有微芯的单电阻smo代码加文档

jQuery左侧导航右侧tab页面切换.zip

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

单电阻采样基于单电阻采样的相电流重构算法 keil完整工程单电阻采样 f103的单电阻，完整工程，带文档，带硬件资料 f3平台的单电阻完整工程，代码详细注释还有微芯的单电阻smo代码加文档