利用PCA主成分分析法和SVM向量机预测上市公司退市风险的Python代码,其中标签是数据最后一列,共17个分类特征
时间: 2023-11-28 09:51:38 浏览: 90
以下是利用PCA和SVM进行上市公司退市风险预测的Python代码:
```python
import pandas as pd
from sklearn.decomposition import PCA
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv("company_data.csv")
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# PCA降维
pca = PCA(n_components=2)
X = pca.fit_transform(X)
# 数据集划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# SVM模型训练
svm = SVC(kernel="linear")
svm.fit(X_train, y_train)
# 模型预测
y_pred = svm.predict(X_test)
# 模型评估
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
其中,`company_data.csv`是包含17个特征和标签的数据文件。首先,我们读取数据并将特征数据(前16列)保存在变量`X`中,将标签数据(最后一列)保存在变量`y`中。接下来,我们使用PCA进行数据降维,将数据压缩到2个维度,以便可视化。然后,我们将数据集划分为训练集和测试集,并使用SVM模型进行训练。最后,我们使用测试集对模型进行评估,计算准确率并输出。
阅读全文