Python机器学习库机器学习库scikit-learn安装与基本使用教程安装与基本使用教程
主要介绍了Python机器学习库scikit-learn安装与基本使用,较为详细的介绍了机器学习库scikit-learn的功能、原
理、基本安装与简单使用方法,需要的朋友可以参考下
本文实例讲述了Python机器学习库scikit-learn安装与基本使用。分享给大家供大家参考,具体如下:
引言引言
scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上能够为用户提供各种机器学习算法
接口,可以让用户简单、高效地进行数据挖掘和数据分析。
scikit-learn安装安装
python 中安装许多模板库之前都有依赖关系,安装 scikit-learn 之前需要以下先决条件:
Python(>= 2.6 or >= 3.3)
NumPy (>= 1.6.1)
SciPy (>= 0.9)
如无意外,下面用 pip 的安装方法可以顺利完成~~
安装安装 numpy
sudo pip install numpy
安装安装 scipy
需要先安装 matplotlib ipython ipython-notebook pandas sympy
sudo apt-get install python-matplotlib ipython ipython-notebook
sudo apt-get install python-pandas python-sympy python-nose
sudo pip install scipy
安装安装 scikit-learn
sudo pip install -U scikit-learn
测试测试
在 terminal 里面输入
pip list
这个会列出 pip 安装的所有东西,如果里面有 sklearn 这一项,应该就是大功告成了!
或者尝试着将几个模板库导入进来
import numpy
import scipy
import sklearn
加载数据加载数据(Data Loading)
本文所使用的数据集为‘今日头条'近期两篇热门新闻“牛!川大学霸寝室5人获16份名校通知书”、“张超凡的最后14天:山西15
岁休学少年是如何殒命网吧的”分别500条评论,共1000条评论。
去除停用词后得到了词库大小为3992的词库。因此构建了1000×3992的特征矩阵,以及长度为1000的对应评论所属类别列表
具体爬虫和特征矩阵构建代码
class_result_save.npy 下载 feature_matrix_save.npy下载
import numpy as np
feature_matrix = np.load('dataSet/feature_matrix_save.npy')
评论0