df5= pd.merge(df5, df1, how='left', left_on='公司代码', right_on='公司代码') numpy.core._exceptions._ArrayMemoryError: Unable to allocate 62.1 GiB for an array with shape (259, 32183100) and data type object

这个错误意味着你的代码尝试在内存中分配 62.1 GiB 的空间，但是没有足够的内存可用。在这种情况下，你需要采取以下措施来解决内存问题: 1. 尝试使用更少的内存来处理数据。例如，你可以使用 Pandas 的 `dtype` 参数来指定列的数据类型，这可以显著减少内存使用量。 2. 尝试分块处理数据。你可以使用 Pandas 的 `read_csv` 函数的 `chunksize` 参数来读取数据的一部分，然后一次处理一部分数据，这样可以减少内存使用量。 3. 使用更多的内存。这可能需要升级你的硬件，例如购买更多的 RAM 或升级到更高级的计算机。 4. 使用分布式计算框架。例如，你可以使用 Apache Spark 或 Dask 这样的分布式计算框架来处理大型数据集。这些框架可以在多台计算机上分布式运行，从而允许你处理比单个计算机内存更大的数据集。

merged_df5 = pd.merge((merged_df3, merged_df4, on=['date'], how='outer') ^ SyntaxError: invalid syntax. Maybe you meant '==' or ':=' instead of '='?

这个错误是因为在调用 `pd.merge()` 函数时，你的语法有误。具体来说，你需要将 `merged_df3` 和 `merged_df4` 两个参数分别传递给 `pd.merge()` 函数，而不是将它们括在一个括号内作为一个参数传递。正确的语法应该是这样的： ```python merged_df5 = pd.merge(merged_df3, merged_df4, on=['date'], how='outer') ``` 请注意，`pd.merge()` 函数的参数是逗号分隔的，而不是用括号括起来的。希望这可以帮助你解决问题。

for i in name_list: data=pd.read_csv(r"D:/批量处理文件/" + i,engine="python") print("{}读取完毕！".format(i)) data['子库代码'].fillna(0, inplace=True) data2 = data[(data["子库代码"] == '0') | (data["子库代码"] < 9999)] num = ['Y', 'N', ] data3 = data2[data2.是否超期标识.isin(num)] n = ['采供中心', '生产管理中心', ] data4 = data3[data3.采购二级部门.isin(n)] v = ['生产管理中心', ] data5 = data4[data4.采购二级部门.isin(v)] m = ['采购部', '采购价格管理部', '价格合约结算部'] data6 = data4[(data4['采购二级部门'] == '采供中心') & (data4['采购三级部门'].isin(m))] set_diff_df = pd.concat([data6, data5, ]) jgo = set_diff_df[set_diff_df['采购类别'].str.contains('生产材料')] df= pd.merge(jgo,da1[['采购类别','所属分会','分会小类','分会类型']],how = 'left',on = '采购类别') df1 = df.dropna(subset=['所属分会']) df2= df1.drop(df1[(df1['所属分会'] == '地弹簧&闭门器分会') &(df1['收货组织'] == 'KL门控事业部库存组织')].index) df3=df2[ ~ df2['订单行类型'].str.contains('需求采购')] df4= pd.merge(df3,db[['收货组织','收货组织简称',]],how = 'left',on = '收货组织') df5= pd.merge(df4,dc[['物料编码','物料类型',]],how = 'left',on = '物料编码') #df5=pd.concat([df4, dc], axis=0) df5['物料类型'].fillna("低频物料", inplace=True) df5["采购类别+事业部"]=df5['采购类别'] + df5['收货组织简称'] df6= pd.merge(df5,dd[['采购类别+事业部','紧急采购周期',]],how = 'left',on = '采购类别+事业部') df6["分会+供应商"]=df6['所属分会'] + df6['供应商代码'] df7= pd.merge(df6,de[['分会+供应商','主力供应商标识',]],how = 'left',on = '分会+供应商') print("{}--处理完毕！".format(i)) df7.to_csv(path_or_buf = r"D:\批量处理文件\{}".format(i), index=None, encoding='utf-8-sig') print("{}--保存完毕！".format(i)) print('-'*20) 代码那里有错误怎么改

根据你提供的代码，我没有看到明显的错误。但是，你可以尝试以下几个步骤来检查和修改代码： 1. 确认导入的库是否正确：你的代码中使用了很多Pandas库的函数，需要确认是否正确导入了这些库。例如，你可以在代码开头添加以下语句来导入Pandas库： ```python import pandas as pd ``` 2. 检查文件路径是否正确：你的代码中使用了文件读取和保存函数，需要确认文件路径是否正确。例如，你可以在文件路径前添加`print()`语句来检查路径是否正确，例如： ```python print(r"D:/批量处理文件/" + i) data=pd.read_csv(r"D:/批量处理文件/" + i,engine="python") ``` 3. 检查数据列名是否正确：你的代码中使用了很多列名，需要确认列名是否正确。例如，你可以在读取数据后使用`print()`函数来输出数据的列名，例如： ```python print(data.columns) ``` 4. 检查数据筛选条件是否正确：你的代码中使用了很多数据筛选条件，需要确认条件是否正确。例如，你可以在筛选数据后使用`print()`函数来输出数据的行数，例如： ```python print(len(data2)) ``` 5. 检查数据合并是否正确：你的代码中使用了很多数据合并函数，需要确认合并是否正确。例如，你可以在合并数据后使用`print()`函数来输出数据的行数，例如： ```python print(len(df4)) ``` 通过逐步检查和修改代码，你应该可以找到和修复错误。

阅读全文

df5= pd.merge(df5, df1, how='left', left_on='公司代码', right_on='公司代码') numpy.core._exceptions._ArrayMemoryError: Unable to allocate 62.1 GiB for an array with shape (259, 32183100) and data type object

merged_df5 = pd.merge((merged_df3, merged_df4, on=['date'], how='outer') ^ SyntaxError: invalid syntax. Maybe you meant '==' or ':=' instead of '='?

相关推荐

16330110_558c2dd6094e47ddcb5e5f5700a83df5.xlsx

基于SpringBoot+Vue物资管理_18df5j3u--论文.rar

AIKB50N65DF5 INFINEON 英飞凌 电子元器件芯片.pdf

Traceback (most recent call last): File "D:\文档\pythonProject\main.py", line 56, in <module> merge_1=pd.merge([df1,df2,df3,df4,df5],on=['year','month','Stkcd']) TypeError: merge() missing 1 required positional argument: 'right'

df5=pd.DataFrame(np.arange(10).reshape(2,5)) s1=pd.Series(np.arange(3)) df5.sub(s1,axis=1)

gram = np.cos(field).reshape(-1, 128) df5 = pd.DataFrame(0, index=range(128), columns=range(128)) for K in range(128): for L in range(128): df5.iloc[K, L] = gram[K][L] * 127.5 + 127.5 array5 = df5.values优化代码

gram = np.cos(field).reshape(-1, 128) print(gram) df5 = pd.DataFrame(0, index=range(128), columns=range(128)) for i in range(128): for j in range(128): df5.iloc[i, j] = gram[i][j] * 127.5 + 127.5 array5 = df5.values优化代码

df5 = pd.DataFrame(0, index=range(128), columns=range(128)) for K in range(128): for L in range(128): df5.iloc[K, L] = gram[K][L] * 127.5 + 127.5 array5 = df5.values优化代码

Traceback (most recent call last): File "D:\文档\pythonProject\main.py", line 56, in <module> merge_1=pd.merge(df1,df2,df3,df5,on=['year','month','Stkcd']) TypeError: merge() got multiple values for argument 'on'

for i in range(len(df3)): df5=df3.iloc[:,i]-df4.iloc[:,i] df5.append(df5） 如何修改优化

df5=df5.append({"batch":name,"pc":d_minus_a_1,"before10M":d_minus_a_2,"after10M":d_minus_a_3},ignore_index=True) 以上代码转换为使用concat函数实现

data1 = {'city': '兰州', 'name': '李红', 'year': '2005', 'sex': 'female'}df5 = df5.append(data1, ignore_index=True)中ignore_index=True是什么意思

df1 = pd.read_excel('E:/应统案例大赛/附件1-股票交易数据/a1.xlsx')做一个循环，读取a1到a14,分别复制为df1到df14

优化代码df1=df[df.name=='Ben'] df2=df[df.name=='Elizabeth'] df3=df[df.name=='John'] df4=df[df.name=='Smith'] df5=df[df.name=='Sherly']

大家在看

多文档应用程序MDI-vc++、MFC基础教程

西安电子科技大学数据库实验参考报告

论文研究-8位CISC微处理器的设计与实现.pdf

基于YOLOv10+DeepSort实现视频中目标跟踪算法Python源码+详细使用说明.zip

电信设备-一种血糖数据查询方法及移动终端.zip

最新推荐

Terraform AWS ACM 59版本测试与实践

【HS1101湿敏电阻全面解析】：从基础知识到深度应用的完整指南

MATLAB在一个图形窗口中创建一行两列的子图的代码

Doks Hugo主题：打造安全快速的现代文档网站

E9流程表单前端接口API(V5)：前端与后端协同开发的黄金法则

c#获取路径 Microsoft.Win32.SaveFileDialog saveFileDialog = new Microsoft.Win32.SaveFileDialog();

CRMSeguros-crx插件：扩展与保险公司CRM集成

揭秘E9流程表单前端接口API(V5)：掌握接口设计与安全性的最佳实践

变成求前n个素数。n的大小由用户键盘输入决定。 用c语言代码解决

共建最大数据结构与算法解决方案库

AIKB50N65DF5 INFINEON 英飞凌电子元器件芯片.pdf

for i in range(len(df3)): df5=df3.iloc[:,i]-df4.iloc[:,i] df5.append(df5）如何修改优化

变成求前n个素数。n的大小由用户键盘输入决定。用c语言代码解决