关联python代码自带数据集
时间: 2024-10-27 09:05:43 浏览: 33
数据挖掘关联规则的数据集和代码
Python标准库并没有内置的数据集,但许多第三方库提供了丰富多样的数据集供学习和开发使用。例如:
1. **scikit-learn**: 提供了多种经典的机器学习数据集,如鸢尾花(Iris)分类、波士顿房价等,可以用于训练和测试模型。
```python
from sklearn import datasets
iris = datasets.load_iris()
```
2. **pandas**: 虽然不是专门的数据集库,但pandas的`read_csv`、`read_excel`等功能可以加载各种格式的CSV、Excel文件,包括一些公开可用的数据集。
```python
df = pd.read_csv('https://example.com/dataset.csv')
```
3. **TensorFlow** 和 **Keras**: 这些深度学习库提供了如MNIST手写数字识别和IMDB电影评论情感分析等预装的数据集。
```python
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
```
4. **UCI Machine Learning Repository**: 网上有很多开源的大型数据集,可通过下载并利用pandas读取,例如UCI的csv格式数据。
```python
data = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
```
5. **Census Income Dataset**: Python库如pycountry花旗银行信用卡申请数据等可以通过requests库直接下载。
阅读全文