掌握Python数据挖掘：《Learning Data Mining with Python 第二版》实战指南

需积分: 9 19 浏览量更新于2024-12-24 1 收藏 1.01MB ZIP 举报

资源摘要信息:"Learning-Data-Mining-with-Python-Second-Edition:Packt使用Python Second Edition学习数据挖掘" 是一本专注于使用Python编程语言进行数据挖掘的书籍。本书详细介绍了如何从基础开始，利用各种数据分析技术和工具集，如分类和亲和力分析，来设计和开发数据挖掘应用程序。它不仅注重理论知识，还提供了大量实际项目文件，帮助读者在实践中学习和掌握数据挖掘的技巧。本书涉及的核心知识点包括： 1. Python基础：Python作为当前最流行的数据科学语言，具有简洁易学的特点。本书将介绍Python基础语法，并展示如何使用Python进行数据挖掘。 2. Jupyter Notebook：一个开源的Web应用程序，允许用户创建和共享包含代码、可视化和文本的文档。它非常适合进行数据挖掘工作，因为它支持交互式编程和数据分析。 3. Pandas库：Pandas是Python中一个强大的数据结构和分析工具库，它提供了易于使用的数据结构和数据分析工具。本书将指导读者如何使用Pandas处理和分析数据集。 4. scikit-learn库：scikit-learn是Python中最流行的机器学习库之一。它包含了大量的算法和工具，用于数据挖掘和数据分析，如分类、回归、聚类等。 5. NLTK库：自然语言处理工具包（NLTK）是Python中最著名的自然语言处理库。本书将展示如何使用NLTK进行文本分析，这在亲和力分析等任务中特别有用。 6. 分类技术：分类是一种有监督的学习方法，通过训练数据集来建立分类模型，以此预测新数据的类别。 7. 亲和力分析：这是一种发现交易数据中不同项目之间有趣关系的方法，常用于市场篮分析，以发现消费者购买行为的模式。代码组织结构：本书的代码存储库采用了结构化的组织方式，代码文件夹以数字开头，后跟应用程序名称（如Chapter02），方便读者按照书籍章节顺序查找和运行代码示例。硬件要求：虽然书中提到不需要计算机也可以阅读，但读者最好有一台计算机来完成书中的练习。推荐使用任何现代处理器（大约从2010年开始的处理器）和相应的配置，无需特别强大的计算机。使用本书，读者可以了解到如何从基础开始，一步步深入数据挖掘的精髓，学会运用各种Python库进行数据分析，从而在数据科学领域迈出坚实的步伐。

收起资源包目录

掌握Python数据挖掘：《Learning Data Mining with Python 第二版》实战指南（38个子文件）

Chapter 5 Advertisements.ipynb 46KB

ch6_create_replicable_dataset.ipynb 2KB

Chapter 11 Keras Introduction.ipynb 123KB

Chapter 5 Adult-checkpoint.ipynb 108KB

.gitignore 649B

affinity_dataset.txt 1000B

CH12 MapReduce Basics.ipynb 38KB

Chapter 12 (Test load).ipynb 2KB

LICENSE 1KB

ch1_oner_application.ipynb 14KB

Chapter 12 (NB Predict).ipynb 10KB

ch7_graph.ipynb 16KB

ch6_recreate_dataset.ipynb 4KB

ch6_label_twitter.ipynb 5KB

chapter 10.ipynb 31KB

ch6_classify_twitter.ipynb 6KB

ch4_movie_recommendation.ipynb 33KB

nb_predict.py 2KB

Chapter 11 Keras Object Recognition.ipynb 62KB

Ionosphere%20Nearest%20Neighbour.ipynb 267KB

.gitattributes 378B

adult_tests.py 1KB

Chapter 11 TensorFlow Introduction.ipynb 19KB

ch6_get_twitter.ipynb 2KB

ch1_affinity_create.ipynb 4KB

Chapter 9 Authorship Analysis.ipynb 57KB

ch8_CAPTCHA.ipynb 192KB

Chapter 12 (NB Predict)-checkpoint.ipynb 10KB

extract_posts.py 804B

Chapter 11 update of CAPTCHA.ipynb 151KB

README.md 3KB

Chapter 5 Adult.ipynb 108KB

chapter3_nba_prediction.ipynb 81KB

ch1_affinity.ipynb 16KB

Chapter 5 Advertisements-checkpoint.ipynb 46KB

Chapter 9 Authorship Analysis.ipynb 248KB

ch8_CAPTCHA.ipynb 748KB

nb_train.py 2KB

共 38 条

ZackRen

粉丝: 28
资源: 4624

掌握Python数据挖掘：《Learning Data Mining with Python 第二版》实战指南

Python数据挖掘实战指南：利用Python挖掘数据，构建预测模型

掌握深度学习：Packt发布的Python深度学习代码存储库

Python数据挖掘实战：创建真实世界的分析应用

Building-Machine-Learning-Systems-With-Python-Second-Edition:Packt Publishing使用Python构建机器学习系统

Learning-Python-Networking-Second-Edition:Packt出版的《学习Python网络-第二版》

Python-Data-Mining-Cookbook：Packt的Python数据挖掘食谱

Python-Data-Analysis-Second-Edition:Packt的Python数据分析第二版

Learning-Geospatial-Analysis-with-Python-Third-Edition:Packt出版的《使用Python学习地理空间分析》第三版

Python-Deep-Learning-Second-Edition:Packt出版的《 Python深度学习第二版》

Python-Data-Science-Essentials-Second-Edition:Packt发行的Python Data Science Essentials Second Edition代码存储库

最新资源