sklearn包datasets
时间: 2023-09-08 13:14:03 浏览: 52
sklearn包中的datasets模块提供了多种数据集,可以用于机器学习和数据分析。这些数据集可以分为几个类型:自带的小数据集、可在线下载的数据集、计算机生成的数据集、svmlight/libsvm格式的数据集和从data.org在线下载获取的数据集。
对于稀疏数据,sklearn使用scipy稀疏的CSR矩阵来存放特征矩阵X,而使用numpy数组来存放目标变量Y。可以使用load_svmlight_file函数来加载svmlight/libsvm格式的数据集。
如果要使用sklearn中的datasets模块,你可以导入相关工具包,并使用对应的函数来加载数据集。例如,使用fetch_california_housing函数可以加载名为fetch_california_housing的数据集。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* [sklearn提供的自带的数据集](https://blog.csdn.net/weixin_34128839/article/details/85901687)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
- *3* [将python机器学习sklearn工具包中的datasets数据探索](https://blog.csdn.net/gracejpw/article/details/101352901)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]