def get_dataset(field):#构造数据集 dataset=pd.DataFrame(field).copy() # 删除无用属性并将label置于最后一列 if 'Date' in dataset.columns.tolist(): dataset.drop(['Merchant_id', 'Discount_rate', 'Date', 'date_received', 'date'], axis=1, inplace=True) label = dataset['label'].tolist() dataset.drop(['label'], axis=1, inplace=True) dataset['label'] = label else: dataset.drop(['Merchant_id', 'Discount_rate', 'date_received'], axis=1, inplace=True) dataset['User_id'] = dataset['User_id'].map(int) dataset['Coupon_id'] = dataset['Coupon_id'].map(int) dataset['Date_received'] = dataset['Date_received'].map(int) dataset['Distance'] = dataset['Distance'].map(int) if 'label' in dataset.columns.tolist(): dataset['label'] = dataset['label'].map(int) dataset.drop_duplicates(keep='first', inplace=True) dataset.index = range(len(dataset)) return dataset将上述代码改写，功能不变

时间: 2023-09-03 21:08:49 浏览: 107

可以将上述代码改写为： ``` def get_dataset(field): dataset = pd.DataFrame(field).copy() if 'Date' in dataset.columns: dataset = dataset.drop(['Merchant_id', 'Discount_rate', 'Date', 'date_received', 'date'], axis=1) if 'label' in dataset.columns: label = dataset['label'].tolist() dataset = dataset.drop(['label'], axis=1) dataset['label'] = label else: dataset = dataset.drop(['Merchant_id', 'Discount_rate', 'date_received'], axis=1) dataset[['User_id', 'Coupon_id', 'Date_received', 'Distance']] = dataset[['User_id', 'Coupon_id', 'Date_received', 'Distance']].astype(int) if 'label' in dataset.columns: dataset['label'] = dataset['label'].astype(int) dataset = dataset.drop_duplicates(keep='first').reset_index(drop=True) return dataset ``` 这里的改动包括： - 将 `if 'Date' in dataset.columns.tolist()` 改为 `if 'Date' in dataset.columns`，因为 `dataset.columns` 已经是一个列表了。 - 将 `dataset.drop(['Merchant_id', 'Discount_rate', 'Date', 'date_received', 'date'], axis=1, inplace=True)` 改为 `dataset = dataset.drop(['Merchant_id', 'Discount_rate', 'Date', 'date_received', 'date'], axis=1)`，因为 `drop` 方法的 `inplace` 参数默认为 `False`，需要将返回值重新赋给 `dataset`。 - 将对 `User_id`、`Coupon_id`、`Date_received` 和 `Distance` 属性的转换方式改为 `dataset[['User_id', 'Coupon_id', 'Date_received', 'Distance']] = dataset[['User_id', 'Coupon_id', 'Date_received', 'Distance']].astype(int)`，可以一次性将四列转换成整型。 - 将对 `label` 属性的转换方式改为 `dataset['label'] = dataset['label'].astype(int)`。 - 将 `dataset.index = range(len(dataset))` 改为 `dataset = dataset.reset_index(drop=True)`，可以更简单地重置索引。

阅读全文

相关推荐

brazilian_coffee_dataset.zip_coffee_dataset (1)_coffee数据集_deep l

dataset_person.zip_Apriori_apriori DATASET_apriori数据集_dataset_pe

utbm_robocar_dataset:带有多个用于自动驾驶的传感器的欧盟长期数据集

解释代码：导入数据集数据集 = pd.read_csv（'Iris.csv'）# 将特征和标签分开X = dataset.iloc[：， ：-1].valuesy = dataset.iloc[：， -1].values

dataset_new_2 = dataset_new.groupby(by='Datetime')['AEP_MW'].sum()*0.00001 print(dataset_new_2) dict_dataset = {'Datetime':dataset_new_2.index,'AEP_MW':dataset_new_2.values} dataset_new_3 = pd.DataFrame(dict_dataset)

8.18发烧购物节活动SOP - 电商日化行业+电商引流转化（5张子表全案）.xlsx

大家在看

Chamber and Station test.pptx

宽带信号下阻抗失配引起的群时延变化的一种计算方法 (2015年)

短消息数据包协议

mediapipe_pose_torch_Android-main.zip

蒸汽冷凝器模型和 PI 控制：具有 PID 控制的蒸汽冷凝器的动态模型。-matlab开发

最新推荐

8.18发烧购物节活动SOP - 电商日化行业+电商引流转化（5张子表全案）.xlsx

网页设计期末大作业基于HTML+CSS的仿中国银行网站源代码.zip

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

opencv的demo程序

NeuronTransportIGA: 使用IGA进行神经元材料传输模拟

【Linux多系统管理大揭秘】：专家级技巧助你轻松驾驭

解释代码：导入数据集数据集 = pd.read_csv（'Iris.csv'）# 将特征和标签分开X = dataset.iloc[：，：-1].valuesy = dataset.iloc[：， -1].values