df_with_dummies = df['data1'].join(dummies)#'Series' object has no attribute 'join'
时间: 2023-08-02 18:10:57 浏览: 158
抱歉,我的回答中有误。这是因为在Pandas中,`join()`方法是DataFrame对象的方法,而不是Series对象的方法。因此,如果要将一个Series对象和一个DataFrame对象连接在一起,应该使用`pd.concat()`函数。
下面是修改后的代码:
```
import pandas as pd
# 创建数据框
df = pd.DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'b'], 'data1': range(6)})
# 对key列进行one-hot编码
dummies = pd.get_dummies(df['key'], prefix='key')
# 将编码结果与原始数据框进行连接
df_with_dummies = pd.concat([df['data1'], dummies], axis=1)
# 输出结果
print(df_with_dummies)
```
这段代码将创建一个数据框(df),包含两列'key'和'data1'。然后,我们对'key'列进行one-hot编码,将结果存储在一个名为'dummies'的变量中。最后,我们使用`pd.concat()`函数将'data1'列和'dummies'数据框连接在一起,将结果存储在一个名为'df_with_dummies'的变量中,并打印输出。
相关问题
df_with_dummies = df[['data1']].join(dummies) df_with_dummies
这是一个将一个数据框(df)中的'data1'列与另一个数据框(dummies)进行连接(join)的操作,并将结果存储在新的数据框(df_with_dummies)中的代码。其中dummies是一个经过one-hot编码的数据框,用于将分类变量转换为二进制变量。这个操作可以用于特征工程中的数据预处理。
def machine_study_forecast(df): df1=clean_date(df) middle_time = pd.to_datetime('2014-12-14') df1['date'] = pd.to_datetime(df1['date']) df2 = df1[df1['date'] > middle_time] df3 = df1[df1['date'] <= middle_time] df_train=pd.get_dummies(df3['behavior_type'],prefix='behavior_type') print(df_train) y=df_train.behavior_type_4.values y = y.reshape(-1, 1) x=df_train.drop(columns=['behavior_type_4']) x=pd.concat([df3,x],axis=1) x=x.drop(columns=['behavior_type']) print(x) print(y) x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0) ann = Sequential() # 创建一个序贯ANN(Artifical Neural Network)模型 ann.add(Dense(units=8, input_dim=8, activation='relu')) # 添加输入层 ann.add(Dense(units=16, activation='relu')) # 添加隐层 ann.add(Dense(units=1, activation='sigmoid')) # 添加输出层 ann.summary() # 显示网络模型(这个语句不是必须的) # SVG(model_to_dot(ann, show_shapes=True).create(prog='dot', format='svg')) ann.compile(optimizer='adam', # 优化器 loss='binary_crossentropy', # 损失函数 metrics=['acc']) # 评估指标 history = ann.fit(x_train, y_train, # 指定训练集 epochs=30, # 指定训练的轮次 batch_size=64, # 指定数据批量 validation_data=(x_test, y_test)) # 指定验证集,这里为了简化模型,直接用测试集数据进行验证
这是一段Python代码,用于进行机器学习预测。其中的步骤包括数据清理、数据处理(如对日期进行转换)、对数据进行编码、制定输入和输出变量,并对数据进行训练和测试。最后用到了Keras深度学习框架中的Sequential类。
阅读全文