首页用机器学习完成信用卡数据分析的代码

用机器学习完成信用卡数据分析的代码

时间: 2024-05-10 19:17:51 浏览: 98

以下是一个简单的信用卡数据分析和预测的代码示例，使用了Python和Scikit-learn库： ``` import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.metrics import confusion_matrix, accuracy_score # 读取数据 data = pd.read_csv('creditcard.csv') # 数据预处理 sc = StandardScaler() data['normalizedAmount'] = sc.fit_transform(data['Amount'].values.reshape(-1, 1)) data = data.drop(['Time', 'Amount'], axis=1) # 划分数据集 X = data.iloc[:, :-1].values y = data.iloc[:, -1].values X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 训练模型 classifier = LogisticRegression(random_state=0) classifier.fit(X_train, y_train) # 预测结果 y_pred = classifier.predict(X_test) # 计算准确率 print('Accuracy:', accuracy_score(y_test, y_pred)) # 计算混淆矩阵 cm = confusion_matrix(y_test, y_pred) print('Confusion Matrix:\n', cm) ``` 其中，信用卡数据存储在一个名为`creditcard.csv`的文件中，数据包括时间、交易金额和其他特征。首先，将数据读入Pandas数据框中，使用`StandardScaler`对金额进行标准化处理，然后将时间和金额特征删除。接下来，使用`train_test_split`函数划分数据集，将80%的数据用于训练，20%的数据用于测试。使用`LogisticRegression`训练模型，并使用`predict`函数进行预测。最后，使用`accuracy_score`函数计算准确率，并使用`confusion_matrix`函数计算混淆矩阵。