python 数据挖掘领域工具包
原文:http://qxde01.blog.163.com/blog/static/67335744201368101922991/
Python 在科学计算领域,有两个重要的扩展模块:Numpy 和 Scipy。其中 Numpy 是一
个用 python 实现的科学计算包。包括:
一个强大的 N 维数组对象 Array;
比较成熟的(广播)函数库;
用于整合 C/C++和 Fortran 代码的工具包;
实用的线性代数、傅里叶变换和随机数生成函数。
SciPy 是一个开源的 Python 算法库和数学工具包,SciPy 包含的模块有最优化、线性
代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和
其他科学与工程中常用的计算。其功能与软件 MATLAB、Scilab 和 GNU Octave 类似。
Numpy 和 Scipy 常常结合着使用,Python 大多数机器学习库都依赖于这两个模块,
绘图和可视化依赖于 matplotlib 模块,matplotlib 的风格与 matlab 类似。Python 机器
学习库非常多,而且大多数开源,主要有:
1. scikit-learn
scikit-learn 是一个基于 SciPy 和 Numpy 的开源机器学习模块,包括分类、回归、聚类
系列算法,主要算法有 SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN 等,目前由 I
NRI 资助,偶尔 Google 也资助一点。
项目主页:
https://pypi.python.org/pypi/scikit-learn/
http://scikit-learn.org/
https://github.com/scikit-learn/scikit-learn
SciKits Index
Aeronautical engineering calculations in Python.
Data structures, algorithms and educational resources for
bioinformatics.
Digital Communication Algorithms with Python
An extension module implimenting the fast marching method
Image processing routines for SciPy