import numpy as np import pandas as pd def read_asc(filepath): asc_file = pd.read_csv(filepath, skiprows=4, encoding="gbk", engine='python', sep=' ', delimiter=None, index_col=False, header=None, skipinitialspace=True) file = np.array(asc_file) data = read_message(file) filter_step_size(data) def read_message(file): mask = file[:, 4] == "107" data = file[mask] return data def filter_step_size(data): diff = np.diff(data[:, 0]) mask = np.logical_and(0.090 < diff, diff < 0.110) success_sum = np.count_nonzero(mask) fail_sum = len(mask) - success_sum result = np.column_stack((data[:-1, 0], data[1:, 0], diff)) result = result[~mask] print("步长通过数: {}".format(success_sum)) print("步长未通过数: {}".format(fail_sum)) print("未通过前一项值:未通过后一项值:差值:") print(result) if __name__ == '__main__': read_asc("E:\package\databin 7-11-2023 9-12-31 am Messages File.asc") 这段代码在运行时报错”Unable to allocate 1.63 GiB for an array with shape (4475770, 49) and data type object“,怎么修改优化

时间: 2024-04-10 16:34:06 浏览: 123

这个错误是由于 NumPy 数组中存在大量的对象类型(object)数据导致的。对象类型的数据通常需要更多的内存空间来存储,因此可能会导致内存不足的错误。

为了解决这个问题,你可以尝试以下优化措施:

  1. 检查数据类型:查看你的数据文件中是否有非数值类型的列。如果有,可以尝试将其转换为适当的数值类型(如整数、浮点数等)来减少内存使用。

  2. 限制读取的列数:在 read_asc 函数中,你可以尝试只读取需要使用的列,而不是将整个文件都读入内存。这样可以减少内存占用。

  3. 分块读取数据:如果数据文件太大,无法一次性读入内存,可以考虑使用 Pandas 的 read_csv 函数的 chunksize 参数来分块读取数据,并在每一块中进行处理。

下面是修改后的代码示例:

import numpy as np
import pandas as pd


def read_asc(filepath):
    usecols = [0, 4]  # 仅读取第0列和第4列
    chunksize = 100000  # 每次读取100000行数据

    for chunk in pd.read_csv(filepath, skiprows=4, encoding="gbk", engine='python', sep=' ', delimiter=None,
                             index_col=False, header=None, skipinitialspace=True, usecols=usecols, chunksize=chunksize):
        file = np.array(chunk)

        data = read_message(file)
        filter_step_size(data)


def read_message(file):
    mask = file[:, 1] == "107"
    data = file[mask]
    return data


def filter_step_size(data):
    diff = np.diff(data[:, 0].astype(float))  # 将第0列转换为浮点数类型
    mask = np.logical_and(0.090 < diff, diff < 0.110)
    success_sum = np.count_nonzero(mask)
    fail_sum = len(mask) - success_sum

    result = np.column_stack((data[:-1, 0], data[1:, 0], diff))
    result = result[~mask]

    print("步长通过数: {}".format(success_sum))
    print("步长未通过数: {}".format(fail_sum))
    print("未通过前一项值:未通过后一项值:差值:")
    print(result)


if __name__ == '__main__':
    read_asc("E:\package\databin 7-11-2023 9-12-31 am Messages File.asc")

通过以上优化,我们限制了读取的列数,使用了分块读取数据的方式,并将第0列转换为浮点数类型,以减少内存占用。希望这能够解决你遇到的问题。如果问题仍然存在,请提供更多关于数据文件的信息,以便我能够给出更准确的解决方案。

向AI提问 loading 发送消息图标

相关推荐

最新推荐

recommend-type

Pandas的read_csv函数参数分析详解

Pandas的`read_csv`函数是数据科学家和分析人员在处理CSV文件时最常用的工具之一。它能够方便地将CSV格式的数据导入到DataFrame对象中,提供了丰富的参数来满足各种复杂需求。下面,我们将深入探讨`read_csv`函数的...
recommend-type

【计算机求职笔试】资源

【计算机求职笔试】资源
recommend-type

(源码)基于Apache Spark Mllib的Bronze机器学习平台.zip

# 基于Apache Spark Mllib的Bronze机器学习平台 ## 项目简介 Bronze是一个构建在Apache Spark Mllib之上的机器学习平台,旨在提供全面的数据接入、转换、训练、测试和输出功能。该平台支持多种机器学习算法模型,并提供丰富的插件来处理数据预处理、特征工程、模型训练和验证等任务。 ## 项目的主要特性和功能 ### 数据处理流程 1. 数据采集从各种数据源(如Fake、File、HDFS)接入数据。 2. 数据预处理对数据进行清洗、转换和格式化。 3. 特征工程生成和选择特征,包括特征提取、转换和选择。 4. 模型训练使用多种分类和回归模型进行训练。 5. 模型验证对训练好的模型进行验证和评估。 6. 模型持久化将训练好的模型保存到持久化存储中。 7. 模型结果输出输出模型的最终结果。 ### 支持的算法模型 #### 分类模型 逻辑回归支持大规模特征和无限训练样例,输出类别数小于1000万。
recommend-type

电影评论网站系统设计与实现.zip

Java项目基于Springboot框架的课程设计,包含LW+ppt
recommend-type

《基于yolov8的纺织品瑕疵检测项目》(包含源码、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip

资源内项目源码是均来自个人的课程设计、毕业设计或者具体项目,代码都测试ok,都是运行成功后才上传资源,答辩评审绝对信服的,拿来就能用。放心下载使用!源码、数据集、部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.dataset.txt文件,仅供学习参考, 切勿用于商业用途。 4、如有侵权请私信博主,感谢支持
recommend-type

入门开发者首选:小程序商城完整源代码解析

### 知识点概述 小程序商城源代码是面向想要构建电商小程序的入门开发者的资源包。它包含了电商小程序运行的基本页面框架和功能模块,包括首页、分类页面、商品详情页以及购物车等,旨在为初学者提供一个学习和开发的平台。 ### 标题知识点 1. **小程序商城**:电商类型的小程序,强调通过微信等平台上的小程序接口实现电子商务交易。 2. **源代码**:包含小程序前端界面的代码、后端服务器逻辑代码、以及数据库交互代码等。为开发者提供了直接修改和学习的原始材料。 ### 描述知识点 1. **首页**:小程序商城的起始页面,通常展示商城的Logo、导航栏、轮播图、推荐商品、促销信息等。 2. **分类页面**:将商品按类别进行划分,便于用户快速找到感兴趣的分类并浏览商品。 3. **详情页**:展示单个商品的详细信息,包括商品图片、描述、规格、库存、价格等,以及购买选项和用户评论。 4. **购物车**:用户可以将商品添加到购物车中,并进行结算。购物车通常支持数量修改、删除商品和全选功能。 ### 标签知识点 1. **电商小程序**:指在微信、支付宝等平台上,通过小程序实现商品的展示、购买、交易等电子商务活动。 2. **小程序**:一种不需要下载安装即可使用的应用,它实现了应用“触手可及”的梦想,用户扫一扫或搜一下即可打开应用。 ### 文件名称列表知识点 1. **移动端小商城DEMO**:一个演示用的小程序商城项目,提供了基础框架和界面,供开发者进行体验和学习。 ### 技术细节 1. **前端开发**:小程序商城前端通常涉及页面布局(使用wxml)、样式定义(使用wxss)、交互逻辑(使用JavaScript)等开发工作。 2. **后端服务**:涉及数据库设计、服务器端逻辑处理、API接口实现等后端技术,使用语言如Node.js、Python等。 3. **小程序框架**:主要使用微信小程序官方提供的开发框架,以及可能的第三方框架,如Taro、uni-app等,实现跨平台兼容。 4. **数据存储**:使用云数据库或其他数据库存储用户数据、商品信息、订单数据等。 5. **用户鉴权**:通过微信开放平台的用户认证体系,实现用户的登录和鉴权。 6. **支付接口**:集成微信支付等支付方式,实现在线支付功能。 7. **安全性**:考虑数据传输加密(HTTPS)、敏感信息加密存储、防止SQL注入等安全问题。 8. **性能优化**:包括图片的懒加载、页面的预加载、代码的压缩和合并等优化手段,以提升用户体验。 9. **交互体验**:优化按钮响应、动画效果、滑动流畅度等,增强用户界面的友好度。 ### 实操建议 开发者在使用这个资源包时,可以从以下几个方面入手: 1. 研究现有代码结构,理解小程序的项目构成,包括目录结构、文件分工等。 2. 学习小程序页面的布局和样式编写方法,掌握wxml和wxss的使用。 3. 分析JavaScript逻辑代码,了解小程序的事件处理、数据绑定、条件渲染等逻辑。 4. 尝试修改页面内容,例如更改样式、添加新的商品信息,以加深对小程序开发的理解。 5. 阅读并理解后端代码,如果有必要,可以根据自己的需求修改后端逻辑。 6. 运行小程序,测试各个功能点是否正常工作,调试过程中注意问题的诊断和解决。 7. 确保在开发过程中遵循开发规范,保证代码的可维护性和扩展性。 开发者通过这个资源包可以快速入门小程序开发,并逐步构建自己的电商小程序平台,最终实现线上销售的目标。
recommend-type

【精准测试】:确保分层数据流图准确性的完整测试方法

# 摘要 分层数据流图(DFD)作为软件工程中描述系统功能和数据流动的重要工具,其测试方法论的完善是确保系统稳定性的关键。本文系统性地介绍了分层DFD的基础知识、测试策略与实践、自动化与优化方法,以及实际案例分析。文章详细阐述了测试的理论基础,包括定义、目的、分类和方法,并深入探讨了静态与动态测试方法以及测试用
recommend-type

phony

### Phony in IT Context In the IT and telecommunications context, **phony** is not commonly used as a technical term but rather appears to be derived from its general meaning—something that is fake or counterfeit. However, when discussing telecommunication frameworks such as GSM, CDMA, SIP (Session
recommend-type

实现视觉贴心体验的jQuery透明度变化返回顶部按钮

根据给定文件信息,下面将详细解释标题和描述中包含的知识点。 ### 知识点一:jQuery基础和概念 jQuery是一个快速、小巧且功能丰富的JavaScript库,它简化了HTML文档遍历和操作、事件处理、动画和Ajax交互。它通过使用一个统一的API来减少代码量和提高开发效率。开发者可以利用jQuery来选取DOM元素、绑定事件处理器、添加动画效果,以及发送Ajax请求等。 ### 知识点二:返回顶部按钮特效实现原理 返回顶部按钮特效是网页交互中常见的功能之一。当用户向下滚动页面超过一定的距离(本例中为1200像素),一个位于页面底部的按钮会变得逐渐透明,这不仅减少了按钮对阅读的干扰,还能够提示用户页面已经向下滚动了相当的距离,从而鼓励用户返回页面顶部。 ### 知识点三:可变透明度效果实现 透明度效果是通过CSS中的`opacity`属性来实现的。`opacity`的值介于0到1之间,0代表完全透明,1代表完全不透明。在jQuery中,可以使用`.css()`方法动态改变元素的`opacity`值,从而创建可变透明度的效果。为了实现当向下滚动超过特定像素值时改变透明度,可以绑定滚动事件(`scroll`)到`window`对象,并在事件处理函数中检查滚动位置,然后根据位置改变按钮的`opacity`。 ### 知识点四:用户体验(UX)设计考量 透明度变化是一种用户体验设计手法,通过调整按钮的可见性,使用户界面更加友好和直观。降低返回顶部按钮的透明度,可以让用户更容易集中注意力在内容上,减少视觉干扰。同时,当用户需要返回到页面顶部时,依然能够看到一个提示性的按钮存在,而不是在没有预期的情况下突然出现一个完全不透明的按钮,这样可以在用户体验上提供连贯性和一致性。 ### 知识点五:jQuery插件和特效应用 虽然本例中描述的是使用纯jQuery代码实现特效,但在实际开发中,开发者可以使用现成的jQuery插件来快速实现类似的页面特效,如返回顶部功能。使用插件的好处是插件通常已经过测试,并且包含各种配置选项,允许开发者快速定制和集成到自己的项目中。但是,了解原生实现方式同样重要,因为它有助于开发者深入理解特效的工作原理。 ### 知识点六:像素值的使用和计算 在描述中提到的“1200像素”,实际上是对用户向下滚动的距离进行了一种量化的度量。在CSS和JavaScript中,像素(px)是常用的长度单位。在jQuery的滚动事件中,可以通过`$(window).scrollTop()`方法获取当前页面已滚动的距离。在确定了特定的像素值后,开发者可以编写条件语句来决定何时改变按钮的透明度,即当滚动距离超过1200像素时。 ### 知识点七:浏览器兼容性和性能优化 在实施特效时,开发者需要考虑代码的兼容性,确保在各种主流浏览器中均能正常工作。此外,考虑到性能因素,特效实现不应该导致滚动事件处理过于复杂或消耗过多计算资源,这可能会引起页面滚动时的卡顿。在实现特效时,可以使用`requestAnimationFrame`等现代技术来优化动画的性能,确保用户界面流畅。 根据以上知识点,开发一个具有透明度变化效果的返回顶部按钮,需要编写jQuery代码来绑定滚动事件,并根据滚动距离动态调整按钮的透明度,同时确保代码的兼容性和性能。这样的特效不仅增强了用户的浏览体验,而且在不干扰主要内容阅读的同时,提供了一个辅助导航的视觉提示。
recommend-type

【版本控制】:分层数据流图的高效维护与变更管理

# 摘要 本文系统地探讨了版本控制和分层数据流图设计的重要性和应用实践。第一章强调版本控制的基础知识和其在软件开发生命周期中的关键作用。第二章详细介绍了分层数据流图的设计原理,包括基本概念、设计方法和表示技巧,以及如何通过这些图解高效地管理和沟通软件设计。第三章探讨了版本控制系统的选择与配置,比较了不同类型系统的特点,并提供了配置主流系统的实际案例。第四章重点讨论分层数据流图的变更管理流程,阐述
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部