输入两种特征并基于逻辑回归对靶标抑制剂活性进行二分类代码
时间: 2023-07-11 13:41:49 浏览: 96
好的,以下是一个简单的二分类逻辑回归模型的代码示例,可以用于基于两个特征对靶标抑制剂活性进行分类。
首先,我们需要导入必要的库,包括numpy、pandas、sklearn等。
```python
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
```
接下来,我们可以使用Pandas从CSV文件中读取数据,并将数据分成特征和标签。
```python
data = pd.read_csv("data.csv")
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
```
在这个例子中,我们假设数据集中有两个特征,我们将这些特征存储在X数组中。我们还假设标签是二进制的,因此我们将标签存储在y数组中。
接下来,我们将数据集分成训练集和测试集。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
我们使用train_test_split函数将数据集分成训练集和测试集。在这个例子中,我们将20%的数据用于测试,其余的用于训练。
接下来,我们可以使用逻辑回归模型来训练我们的数据。
```python
model = LogisticRegression()
model.fit(X_train, y_train)
```
我们使用LogisticRegression类创建一个逻辑回归模型,并使用fit函数对训练数据进行拟合。
最后,我们可以使用测试集来评估模型的性能。
```python
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
我们使用predict函数来预测测试集的标签,并使用accuracy_score函数来计算模型的准确度。
完整的代码示例如下:
```python
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv("data.csv")
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
model = LogisticRegression()
model.fit(X_train, y_train)
# 测试模型
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
请注意,这只是一个简单的示例代码,实际应用中,您需要根据数据集的特点进行适当的调整和优化,以获得更好的性能和准确度。
阅读全文