pd.DataFrame内存错误

当使用 Pandas 的 DataFrame 对象时，可能会遇到内存错误。这可能是因为 DataFrame 中的数据量太大，超出了计算机的内存限制。为了解决这个问题，可以尝试以下方法： 1. 使用更大的计算机或增加内存。 2. 将数据分割成更小的块进行处理。 3. 只读取需要的列或行。 4. 将数据存储在硬盘上，而不是内存中，使用类似于 HDF5 或 Apache Parquet 的格式。 5. 通过使用数据类型更小的列来减少内存使用，例如使用整数类型而不是浮点类型。 6. 使用 Pandas 的分类数据类型，可以极大地减少内存使用。希望这些方法能够帮助你解决内存错误问题。

inputfile='/Users/mac/Desktop/apriori.txt' data1 = pd.read_csv(inputfile, header=None, dtype = object) ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数 b = map(ct, data1.values()) #用map方式执行 data = pd.DataFrame(b).fillna(0) #实现矩阵转换，空值用0填充 print('\n转换完毕') del b #删除中间变量b，节省内存. 报错内容'numpy.ndarray' object is not callable 怎么改

这个错误通常是因为使用了一个numpy数组作为函数。在你的代码中，可能是因为将一个numpy数组作为了参数传递给了`map`函数。你可以尝试将`data1.values()`转换为列表类型，然后再使用`map`函数。修改后的代码如下： ``` import pandas as pd inputfile='/Users/mac/Desktop/apriori.txt' data1 = pd.read_csv(inputfile, header=None, dtype=object) ct = lambda x: pd.Series(1, index=x[pd.notnull(x)]) # 转换0-1矩阵的过渡函数 b = map(ct, data1.values.tolist()) # 用map方式执行 data = pd.DataFrame(b).fillna(0) # 实现矩阵转换，空值用0填充 print('\n转换完毕') del b # 删除中间变量b，节省内存 ``` 这样就能够避免这个错误了。

from mlxtend.frequent_patterns import apriori import numpy as np from future import print_function import pandas as pd inputfile = '/Users/mac/Desktop/apr.txt' #输入事务集文件 data1 = pd.read_csv(inputfile, header=None, dtype = object) print(u'\n转换原始数据至0-1矩阵...') ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数 b = map(ct, data1.values()) #用map方式执行 data1 = pd.DataFrame(b).fillna(0) #实现矩阵转换，空值用0填充 print('\n转换完毕') del b #删除中间变量b，节省内存 support = 0.06 #最小支持度 confidence = 0.75 #最小置信度 ms = '---' #连接符，默认'--'，用来区分不同元素，如A--B。需要保证原始表格中不含有该字符 print(u'\n开始搜索关联规则...') find_rule(data1, support, confidence, ms) print(u'\n搜索完成') 报错'numpy.ndarray' object is not callable 求修改代码

根据你提供的信息，代码中没有包含 `find_rule` 函数的定义，因此我无法确定该函数中是否存在其他错误。但是，可以看出代码中存在一个问题，即在使用 `map` 函数时，应该将其结果转换为列表。以下是修改后的代码： ```python from mlxtend.frequent_patterns import apriori import numpy as np from __future__ import print_function import pandas as pd inputfile = '/Users/mac/Desktop/apr.txt' #输入事务集文件 data1 = pd.read_csv(inputfile, header=None, dtype = object) print(u'\n转换原始数据至0-1矩阵...') ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数 b = list(map(ct, data1.values)) #用map方式执行，并将结果转换为列表 data1 = pd.DataFrame(b).fillna(0) #实现矩阵转换，空值用0填充 print('\n转换完毕') del b #删除中间变量b，节省内存 support = 0.06 #最小支持度 confidence = 0.75 #最小置信度 ms = '---' #连接符，默认'--'，用来区分不同元素，如A--B。需要保证原始表格中不含有该字符 print(u'\n开始搜索关联规则...') #在这里调用 find_rule 函数 find_rule(data1, support, confidence, ms) print(u'\n搜索完成') ``` 请注意，此处仅仅是对代码中的一个问题进行了修改，如果代码中还有其他问题，还需要进一步调试。

pd.DataFrame内存错误

相关推荐

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

pd.DataFrame统计各列数值多少的实例

pandas.DataFrame 索引

pd.to_numeric

python pd.read_csv（）参数

pd.read_csv（）可以输出那些参数

python dataframe append

df['time_stamp'] = df['Time stamp'].apply(lambda x : con_date(x)) NameError: name 'df' is not defined

继续报错only integer scalar arrays can be converted to a scalar index，求修改代码，以及此处x指什么

怎么用python把.nc数据转成.csv数据

NameError: name 'df' is not defined

python批量将一万多个txt文件导入到一个excel文件中，如何写代码

python pandas 写 excel

最新推荐

QT5开发及实例配套源代码.zip

grpcio-1.46.3-cp37-cp37m-musllinux_1_1_i686.whl

大学生毕业答辨ppt免费模板【不要积分】下载可编辑可用(138).zip

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

用Spring boot和vue写一个登录注册界面

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

MATLAB柱状图在数据分析中的作用：从可视化到洞察