python打开文件统计多个字段并将结果保存到另一个文件

好的，这是一个关于 Python 文件处理的问题。你可以使用 Python 内置库来打开文件并统计多个字段，然后将结果保存到另一个文件中。具体的实现方式可以根据你的需求进行选择，可以使用 split() 方法来分割每个字段，也可以使用正则表达式来匹配每个字段。建议使用 Pandas 库来进行数据处理和操作，可以更加方便和高效。

文本文件(.csv文件可以作为文本文件处理）中保存了图书馆藏书信息，每条藏书记录占一行数据字段说明： LIBRARY_ID：藏馆ID（可能有多个藏馆） REC_CTRL_I：录入编号 BOOK_BARCO：图书条码 DEPARTMENT：所属部门 BOOK_SEARC：索书号 TITLE：图书名称 ISN：ISBN出版号 AUTHORS：作者 PUBLISHER：出版社 PUBDATE_DA：出版时间 BOOK_ATTRI：图书属性 BOOK_STATU：图书状态（用函数定义不用pandas）统计每个出版社的”开发“字样藏书数量，（用函数定义不用pandas）按照该藏书数量降序输出，数量相同按照出版社名字升序。最后将结果写入result.txt文件中

好的，我可以帮你写一个 Python 函数来完成这个任务。请确认以下几点： 1. 数据文件的路径和名称是什么？ 2. 藏书记录文件是以逗号分隔的 CSV 格式吗？ 3. 按照哪个字段进行统计“开发”字样藏书数量？假设数据文件名为“books.csv”，藏书记录是以逗号分隔的 CSV 格式，按照“出版社”字段进行统计“开发”字样藏书数量，以下是代码实现： ```python def count_books_by_publisher(): # 打开数据文件 with open('books.csv', 'r') as f: # 读取文件内容并转换为字符串列表 lines = f.readlines() # 定义一个字典来记录每个出版社的“开发”藏书数量 publisher_counts = {} # 遍历每一行藏书记录 for line in lines: # 分隔每一行记录，获得各个字段的值 fields = line.strip().split(',') # 获取出版社名称 publisher = fields[8] # 获取图书名称 title = fields[6] # 判断图书名称是否包含“开发”字样 if '开发' in title: # 如果出版社不在字典中，则初始化该出版社的计数为0 if publisher not in publisher_counts: publisher_counts[publisher] = 0 # 增加该出版社的计数 publisher_counts[publisher] += 1 # 对字典按照值进行降序排序 sorted_counts = sorted(publisher_counts.items(), key=lambda x: (-x[1], x[0])) # 打开结果文件 with open('result.txt', 'w') as f: # 遍历排序后的字典项，将结果写入文件 for publisher, count in sorted_counts: f.write(f'{publisher}: {count}\n') ``` 这个函数会读取“books.csv”文件，遍历每一行藏书记录，判断每一行记录的“图书名称”字段是否包含“开发”字样，如果包含，则将该藏书所属的出版社计数加1。最后，对所有出版社的计数进行降序排序，并将结果写入“result.txt”文件中。请注意，这个函数没有使用 pandas 模块，而是直接读取文件并进行字符串处理。如果您的 CSV 文件比较大，或者需要进行更复杂的数据处理，建议使用 pandas 模块来处理数据。

（用函数定义不用pandas）文本文件(.csv文件可以作为文本文件处理）中保存了图书馆藏书信息，每条藏书记录占一行数据字段说明： LIBRARY_ID：藏馆ID（可能有多个藏馆） REC_CTRL_I：录入编号 BOOK_BARCO：图书条码 DEPARTMENT：所属部门 BOOK_SEARC：索书号 TITLE：图书名称 ISN：ISBN出版号 AUTHORS：作者 PUBLISHER：出版社 PUBDATE_DA：出版时间 BOOK_ATTRI：图书属性 BOOK_STATU：图书状态请列出所有书名中包括“开发”字样的藏书，并列出这些藏书所属的出版社，统计每个出版社的”开发“字样藏书数量，按照该藏书数量降序输出，数量相同按照出版社名字升序。最后将结果写入result.txt文件中

以下是一个解决方案，将其保存为.py文件并运行即可： ```python def count_books(file_path): # 打开文件并读取所有行 with open(file_path, 'r') as f: lines = f.readlines() # 统计每个出版社包含“开发”字样的藏书数量 publisher_dict = {} for line in lines: if '开发' in line: # 获取出版社名字 publisher = line.split(',')[9] # 将该出版社的藏书数量加一 if publisher in publisher_dict: publisher_dict[publisher] += 1 else: publisher_dict[publisher] = 1 # 按照藏书数量排序，数量相同按照出版社名字升序 sorted_publisher_list = sorted(publisher_dict.items(), key=lambda x: (-x[1], x[0])) # 将结果写入文件 with open('result.txt', 'w') as f: for publisher, count in sorted_publisher_list: f.write(f'{publisher}: {count}\n') ``` 其中，`file_path`参数是包含藏书信息的文本文件的路径。请将其替换为您实际使用的文件路径。此函数将输出结果写入名为`result.txt`的文件中。

阅读全文

python打开文件统计多个字段并将结果保存到另一个文件

相关推荐

python可以统计文件的行数

将文件中的单词统计存入另一文件

es_uniqueDataPull:从ElasticSearch索引字段中提取所有唯一值，并将这些值保存在txt文件和csv中

文件操作-如何对运营数据文件进行分类整理-Python实例源码.zip

Python实现将MySQL数据库表中的数据导出生成csv格式文件的方法

文件系统操作轻松掌握：Python内置函数在文件读写与管理中的妙用（与文件系统）

python入门-CSV文件高效处理技巧详解

Python库文件学习之registration.models代码复用：提升开发效率的秘诀

【Python库文件学习之Django GIS GDAL原型篇】：入门与环境配置

Python读取CSV文件：处理复杂数据和异常情况

Python精英教程：处理CSV文件的最佳实践

使用Python处理CSV文件中的数据重复与冗余问题

Python新手必读：零基础管理CSV文件数据

Python中使用csv模块读取与处理txt文件

基于双区间熵重映射的图像对比度增强方法研究

软考知识点-系统架构设计师-计算机网络与软件工程关键技术综述

农家乐内部管理系统 SSM毕业设计 附带论文.zip

最新推荐

Python 合并多个TXT文件并统计词频的实现

Python实现调用另一个路径下py文件中的函数方法总结

Python将一个CSV文件里的数据追加到另一个CSV文件的方法

python如何将两个txt文件内容合并

Python实现将一个大文件按段落分隔为多个小文件的简单操作方法

构建基于Django和Stripe的SaaS应用教程

管理建模和仿真的文件

R语言数据处理与GoogleVIS集成：一步步教你绘图

如何使用Matlab实现PSO优化SVM进行多输出回归预测？请提供基本流程和关键步骤。

Symfony2框架打造的RESTful问答系统icare-server

农家乐内部管理系统 SSM毕业设计附带论文.zip