文本文件(.csv文件可以作为文本文件处理)中保存了图书馆藏书信息,每条藏书记录占一行 数据字段说明: LIBRARY_ID:藏馆ID(可能有多个藏馆) REC_CTRL_I:录入编号 BOOK_BARCO:图书条码 DEPARTMENT:所属部门 BOOK_SEARC:索书号 TITLE:图书名称 ISN:ISBN出版号 AUTHORS:作者 PUBLISHER:出版社 PUBDATE_DA:出版时间 BOOK_ATTRI:图书属性 BOOK_STATU:图书状态 (用函数定义不用pandas)统计每个出版社的”开发“字样藏书数量,(用函数定义不用pandas)按照该藏书数量降序输出,数量相同按照出版社名字升序。最后将结果写入result.txt文件中
时间: 2024-03-04 17:48:39 浏览: 71
好的,我可以帮你写一个 Python 函数来完成这个任务。请确认以下几点:
1. 数据文件的路径和名称是什么?
2. 藏书记录文件是以逗号分隔的 CSV 格式吗?
3. 按照哪个字段进行统计“开发”字样藏书数量?
假设数据文件名为“books.csv”,藏书记录是以逗号分隔的 CSV 格式,按照“出版社”字段进行统计“开发”字样藏书数量,以下是代码实现:
```python
def count_books_by_publisher():
# 打开数据文件
with open('books.csv', 'r') as f:
# 读取文件内容并转换为字符串列表
lines = f.readlines()
# 定义一个字典来记录每个出版社的“开发”藏书数量
publisher_counts = {}
# 遍历每一行藏书记录
for line in lines:
# 分隔每一行记录,获得各个字段的值
fields = line.strip().split(',')
# 获取出版社名称
publisher = fields[8]
# 获取图书名称
title = fields[6]
# 判断图书名称是否包含“开发”字样
if '开发' in title:
# 如果出版社不在字典中,则初始化该出版社的计数为0
if publisher not in publisher_counts:
publisher_counts[publisher] = 0
# 增加该出版社的计数
publisher_counts[publisher] += 1
# 对字典按照值进行降序排序
sorted_counts = sorted(publisher_counts.items(), key=lambda x: (-x[1], x[0]))
# 打开结果文件
with open('result.txt', 'w') as f:
# 遍历排序后的字典项,将结果写入文件
for publisher, count in sorted_counts:
f.write(f'{publisher}: {count}\n')
```
这个函数会读取“books.csv”文件,遍历每一行藏书记录,判断每一行记录的“图书名称”字段是否包含“开发”字样,如果包含,则将该藏书所属的出版社计数加1。最后,对所有出版社的计数进行降序排序,并将结果写入“result.txt”文件中。
请注意,这个函数没有使用 pandas 模块,而是直接读取文件并进行字符串处理。如果您的 CSV 文件比较大,或者需要进行更复杂的数据处理,建议使用 pandas 模块来处理数据。
阅读全文