python从txt中提取关键字所在行，并删除重复项后生成新的txt

可以使用Python中的set数据结构来实现该功能。以下是一个示例代码： ```python # 定义关键字 keywords = ["apple", "banana", "orange"] # 读取原始文本文件 with open("input.txt", "r") as f: lines = f.readlines() # 查找包含关键字的行 matched_lines = set() for i, line in enumerate(lines): if any(keyword in line for keyword in keywords): matched_lines.add(i) # 生成新的文本文件 with open("output.txt", "w") as f: for i in matched_lines: f.write(lines[i]) # 输出结果 print("提取并去重后的文本文件已生成。") ``` 在这个示例中，我们首先定义了关键字列表。然后读取了原始文本文件，并使用enumerate函数获取每一行的行号和内容。接着，我们使用了一个for循环和any函数来查找包含关键字的行，并将其行号加入到一个set集合中去重。最后，我们使用了一个for循环和write函数将匹配的行写入到新的文本文件中。需要注意的是，以上示例代码仅适用于小型文本文件。如果原始文件很大，可以考虑使用迭代器或者分块读取的方式来处理。

python从千行的csv中提取关键字所在行，并删除重复项后生成新的CSV

可以使用Python内置的csv模块来处理csv文件，具体实现步骤如下： 1.打开原始csv文件，使用csv.reader读取所有行的数据 2.遍历每一行数据，将包含关键字的行存储到一个列表中 3.去除列表中的重复行 4.将去重后的数据写入一个新的csv文件中，使用csv.writer写入数据以下是一个示例代码，假设原始csv文件为data.csv，关键字为keyword，新的csv文件为output.csv： ```python import csv # 打开原始csv文件 with open('data.csv', 'r', encoding='utf-8') as f: reader = csv.reader(f) rows = [row for row in reader if 'keyword' in row] # 找到包含关键字的行 # 去除重复行 unique_rows = list(set(tuple(row) for row in rows)) # 写入新的csv文件 with open('output.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.writer(f) for row in unique_rows: writer.writerow(row) ``` 需要注意的是，以上代码中的关键字是区分大小写的，如果需要忽略大小写，可以将if条件改为`'keyword' in [data.lower() for data in row]`。

阅读全文

python从txt中提取关键字所在行，并删除重复项后生成新的txt

python从千行的csv中提取关键字所在行，并删除重复项后生成新的CSV

相关推荐

如何利用Python从PDF中提取关键字并统计次数到Excel

Python中FlashText模块：关键字替换与提取技巧

Python提取txt文本中的二级域名并进行字符频数分析

python提取包含关键字的整行数据方法

利用VScode集成终端执行Python脚本的技巧

【Python数据处理】：Pandas库的深度数据操作技术

【Python数据分析】：Pandas实用技巧让你数据分析更高效

【Python数据清洗】：如何优雅地隐藏DataFrame的Index，让你的数据处理更加高效

Oracle FSG报表生成器高级功能：实现技巧与案例展示

【docutils.parsers.rst源码剖析】：深入理解其工作原理，打造高效文档生成工具

【线性代数习题集：提升解题实力】：100题带你从新手到高手

IntelliJ IDEA中的代码导航与代码编辑技巧

数值分析中的三角矩阵：清华大学数据结构讲义的深入解读

高级SQL在数据分析中的应用：CAP认证的8大实战指南

【数据类型转换秘籍】：Oracle数据库中BLOB转CLOB的权威指南

程序员必备：从零开始实现矩阵压缩的完整指南

【PatternMatchUtils实战手册】：从入门到进阶的完整指南

【SVD实战指南】：从理论到实践，彻底掌握奇异值分解

PowerBI DAX函数进阶课程：从迭代器到高级计算的跨越式进步

大家在看

silvaco中文学习资料

AES128（CBC或者ECB）源码

EMC VNX 5300使用安装

华为MA5671光猫使用 华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载

视频转换芯片 TP9950 iic 驱动代码

最新推荐

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

掌握Android RecyclerView拖拽与滑动删除功能

【IBM HttpServer入门全攻略】：一步到位的安装与基础配置教程

[root@localhost~]#mount-tcifs-0username=administrator,password=hrb.123456//192.168.100.1/ygptData/home/win mount：/home/win：挂载点不存在

惠普8594E与IT8500系列电子负载使用教程

MATLAB与Python在SAR点目标仿真中的对决：哪种工具更胜一筹？

华为MA5671光猫使用华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集