python打开文件统计多个字段并将结果保存到另一个文件
时间: 2024-05-30 18:14:18 浏览: 156
好的,这是一个关于 Python 文件处理的问题。你可以使用 Python 内置库来打开文件并统计多个字段,然后将结果保存到另一个文件中。具体的实现方式可以根据你的需求进行选择,可以使用 split() 方法来分割每个字段,也可以使用正则表达式来匹配每个字段。建议使用 Pandas 库来进行数据处理和操作,可以更加方便和高效。
相关问题
文本文件(.csv文件可以作为文本文件处理)中保存了图书馆藏书信息,每条藏书记录占一行 数据字段说明: LIBRARY_ID:藏馆ID(可能有多个藏馆) REC_CTRL_I:录入编号 BOOK_BARCO:图书条码 DEPARTMENT:所属部门 BOOK_SEARC:索书号 TITLE:图书名称 ISN:ISBN出版号 AUTHORS:作者 PUBLISHER:出版社 PUBDATE_DA:出版时间 BOOK_ATTRI:图书属性 BOOK_STATU:图书状态 (用函数定义不用pandas)统计每个出版社的”开发“字样藏书数量,(用函数定义不用pandas)按照该藏书数量降序输出,数量相同按照出版社名字升序。最后将结果写入result.txt文件中
好的,我可以帮你写一个 Python 函数来完成这个任务。请确认以下几点:
1. 数据文件的路径和名称是什么?
2. 藏书记录文件是以逗号分隔的 CSV 格式吗?
3. 按照哪个字段进行统计“开发”字样藏书数量?
假设数据文件名为“books.csv”,藏书记录是以逗号分隔的 CSV 格式,按照“出版社”字段进行统计“开发”字样藏书数量,以下是代码实现:
```python
def count_books_by_publisher():
# 打开数据文件
with open('books.csv', 'r') as f:
# 读取文件内容并转换为字符串列表
lines = f.readlines()
# 定义一个字典来记录每个出版社的“开发”藏书数量
publisher_counts = {}
# 遍历每一行藏书记录
for line in lines:
# 分隔每一行记录,获得各个字段的值
fields = line.strip().split(',')
# 获取出版社名称
publisher = fields[8]
# 获取图书名称
title = fields[6]
# 判断图书名称是否包含“开发”字样
if '开发' in title:
# 如果出版社不在字典中,则初始化该出版社的计数为0
if publisher not in publisher_counts:
publisher_counts[publisher] = 0
# 增加该出版社的计数
publisher_counts[publisher] += 1
# 对字典按照值进行降序排序
sorted_counts = sorted(publisher_counts.items(), key=lambda x: (-x[1], x[0]))
# 打开结果文件
with open('result.txt', 'w') as f:
# 遍历排序后的字典项,将结果写入文件
for publisher, count in sorted_counts:
f.write(f'{publisher}: {count}\n')
```
这个函数会读取“books.csv”文件,遍历每一行藏书记录,判断每一行记录的“图书名称”字段是否包含“开发”字样,如果包含,则将该藏书所属的出版社计数加1。最后,对所有出版社的计数进行降序排序,并将结果写入“result.txt”文件中。
请注意,这个函数没有使用 pandas 模块,而是直接读取文件并进行字符串处理。如果您的 CSV 文件比较大,或者需要进行更复杂的数据处理,建议使用 pandas 模块来处理数据。
(用函数定义不用pandas)文本文件(.csv文件可以作为文本文件处理)中保存了图书馆藏书信息,每条藏书记录占一行 数据字段说明: LIBRARY_ID:藏馆ID(可能有多个藏馆) REC_CTRL_I:录入编号 BOOK_BARCO:图书条码 DEPARTMENT:所属部门 BOOK_SEARC:索书号 TITLE:图书名称 ISN:ISBN出版号 AUTHORS:作者 PUBLISHER:出版社 PUBDATE_DA:出版时间 BOOK_ATTRI:图书属性 BOOK_STATU:图书状态 请列出所有书名中包括“开发”字样的藏书,并列出这些藏书所属的出版社,统计每个出版社的”开发“字样藏书数量,按照该藏书数量降序输出,数量相同按照出版社名字升序。最后将结果写入result.txt文件中
以下是一个解决方案,将其保存为.py文件并运行即可:
```python
def count_books(file_path):
# 打开文件并读取所有行
with open(file_path, 'r') as f:
lines = f.readlines()
# 统计每个出版社包含“开发”字样的藏书数量
publisher_dict = {}
for line in lines:
if '开发' in line:
# 获取出版社名字
publisher = line.split(',')[9]
# 将该出版社的藏书数量加一
if publisher in publisher_dict:
publisher_dict[publisher] += 1
else:
publisher_dict[publisher] = 1
# 按照藏书数量排序,数量相同按照出版社名字升序
sorted_publisher_list = sorted(publisher_dict.items(), key=lambda x: (-x[1], x[0]))
# 将结果写入文件
with open('result.txt', 'w') as f:
for publisher, count in sorted_publisher_list:
f.write(f'{publisher}: {count}\n')
```
其中,`file_path`参数是包含藏书信息的文本文件的路径。请将其替换为您实际使用的文件路径。此函数将输出结果写入名为`result.txt`的文件中。
阅读全文