import pandas as pd data = pd.read_csv(r"D:\BaiduNetdiskDownload\sklearn_dhios\数据集\Narrativedata.csv",index_col=0) from sklearn.preprocessing import LabelEncoder data.iloc[:,-1]=LabelEncoder().fit_transform(data.iloc[:,-1]) from sklearn.preprocessing import OrdinalEncoder data_=data.copy() data_.iloc[:,1:-1] OrdinalEncoder().fit(data_.iloc[:,1:-1]).categories_
时间: 2024-01-15 11:03:29 浏览: 211
快速解决pandas.read_csv()乱码的问题
5星 · 资源好评率100%
你想问的是,如何使用sklearn的OrdinalEncoder对数据集进行编码并获取编码后的类别列表,对吗?
以下是编码数据集并获取编码后的类别列表的代码示例:
```python
import pandas as pd
from sklearn.preprocessing import OrdinalEncoder
data = pd.read_csv(r"D:\BaiduNetdiskDownload\sklearn_dhios\数据集\Narrativedata.csv", index_col=0)
# 使用LabelEncoder对目标变量进行编码
from sklearn.preprocessing import LabelEncoder
data.iloc[:, -1] = LabelEncoder().fit_transform(data.iloc[:, -1])
data_ = data.copy()
# 使用OrdinalEncoder对特征变量进行编码
encoder = OrdinalEncoder()
encoded_data = encoder.fit_transform(data_.iloc[:, 1:-1])
# 获取编码后的类别列表
categories = encoder.categories_
print(categories)
```
这段代码首先使用pandas库的`read_csv`函数读取csv文件,并使用LabelEncoder对目标变量进行编码。然后,使用OrdinalEncoder对特征变量进行编码,并将编码后的数据保存在`encoded_data`中。最后,通过`encoder.categories_`获取特征变量的编码后的类别列表,并打印输出。
请确保文件路径正确,并且已经安装了所需的库。希望对你有帮助!如果你还有其他问题,请随时提问。
阅读全文