Python机器学习库mljar-supervised 0.7.4发布

版权申诉

41 浏览量更新于2024-10-07 收藏 70KB GZ 举报

资源摘要信息:"Python库 | mljar-supervised-0.7.4.tar.gz" mljar-supervised是一个基于Python的机器学习库，专门用于自动化监督学习。它提供了一套工具，可以让数据科学家和机器学习工程师快速地构建和比较不同的机器学习模型。在本节中，我们将详细介绍mljar-supervised库的特点、功能以及如何在项目中使用它。首先，我们要了解什么是监督学习。监督学习是一种机器学习方法，它根据带有标签的数据集来训练模型。标签是用于预测的输出值，而数据集的输入值被用来训练模型以预测这些标签。mljar-supervised库支持广泛的监督学习算法，包括回归、二分类、多分类以及多标签分类。 mljar-supervised库的一个主要优势是它能够自动化地进行模型选择和优化。它利用了诸如自动交叉验证、超参数优化以及自动化特征工程等高级技术。这使得即使是初学者也能轻松地构建出强大的模型。开发者只需要提供数据集，库就可以自动选择最佳的算法和参数，大大减少了进行数据建模的时间。此外，mljar-supervised还具备了高度的可解释性。它提供了一种方式来可视化每个特征对模型预测的影响。这使得用户可以理解模型的决策过程，并为最终用户提供了一个清晰的解释。这对于那些需要遵守严格监管标准的领域（如金融和医疗保健）尤其有用。 mljar-supervised库还支持多种数据预处理功能，如缺失值处理、数据归一化、特征编码和特征选择等。这些功能帮助用户清理和准备数据，以便更好地训练模型。在mljar-supervised库中，有一个特别的功能是自动特征工程。它可以根据数据集自动生成新的特征，并评估这些特征对模型性能的影响。这样，模型开发者可以快速找到对预测最有用的特征，并通过比较不同的特征组合来优化模型。在使用mljar-supervised时，用户通常需要经过以下步骤： 1. 数据准备：导入数据并进行必要的预处理，如处理缺失值、编码类别特征等。 2. 模型训练：选择数据集的目标变量，并调用库提供的API来训练模型。 3. 模型评估：使用库提供的交叉验证功能对模型进行评估。 4. 特征分析：分析哪些特征对模型预测最为重要，并可选地进行进一步的特征工程。 5. 模型比较：如果有多个模型，库可以帮助用户比较它们的性能，以便选择最佳模型。 mljar-supervised库的另一个亮点是它支持多种机器学习算法。它并不局限于单一算法，而是提供了一个框架，允许使用不同的算法，包括但不限于随机森林、梯度提升决策树、支持向量机、神经网络和线性回归模型等。开发者可以根据具体问题和数据集特性选择最适合的算法。在实际应用中，mljar-supervised库可以用于各种场景，例如： - 在金融领域，可以用来预测客户的信用风险，为贷款决策提供支持。 - 在医疗领域，它可以用来预测疾病的发生或患者的生存率。 - 在零售领域，它可以用来预测顾客的购买行为或预测产品的销售趋势。 - 在工业领域，它可以用于预测机器的故障或维护需求，以提高生产效率和安全性。总之，mljar-supervised库为机器学习项目提供了一个强大的工具集，可以显著简化模型的开发和部署过程。无论是初学者还是经验丰富的数据科学家，都可以通过使用这个库来提高他们的工作流程效率，并创造出更准确的预测模型。

收起资源包目录

Python库 | mljar-supervised-0.7.4.tar.gz （86个子文件）

__init__.py 0B

total_time_constraint.py 1KB

factory.py 872B

setup.py 1KB

max_iters_constraint.py 607B

dependency_links.txt 1B

__init__.py 0B

label_binarizer.py 2KB

constants.py 173B

text_transformer.py 2KB

additional_metrics.py 22KB

LICENSE 1KB

test_validation_step.py 1KB

xgboost.py 9KB

label_encoder.py 1KB

preprocessing_utils.py 3KB

ensemble.py 13KB

shap.py 12KB

exceptions.py 384B

terminate_on_nan.py 932B

data_info.py 3KB

registry.py 2KB

extra_trees.py 5KB

knn.py 3KB

time_controller.py 8KB

README.md 14KB

preprocessing_tuner.py 5KB

test_validator_with_dataset.py 1KB

test_validator_split.py 2KB

preprocessing_missing.py 4KB

PKG-INFO 17KB

validator_base.py 219B

lightgbm.py 7KB

algorithm.py 2KB

__init__.py 60B

exclude_missing_target.py 2KB

__init__.py 0B

linear.py 5KB

baseline.py 2KB

automl.py 15KB

decision_tree.py 6KB

learning_curves.py 4KB

hill_climbing.py 2KB

setup.cfg 38B

encoding_selector.py 593B

subsample.py 464B

datetime_transformer.py 3KB

__init__.py 184B

validator_split.py 2KB

config.py 287B

requirements.txt 273B

validator_kfold.py 3KB

nn.py 4KB

__init__.py 0B

learner_time_constraint.py 2KB

preprocessing.py 23KB

mljar_tuner.py 21KB

base_automl.py 52KB

catboost.py 7KB

SOURCES.txt 3KB

top_level.txt 11B

leaderboard_plots.py 2KB

early_stopping.py 7KB

run.py 409B

random_forest.py 5KB

data_validation.py 888B

preprocessing_categorical.py 3KB

model_framework.py 15KB

metric.py 2KB

requirements_dev.txt 48B

MANIFEST.in 47B

__init__.py 0B

goldenfeatures_transformer.py 8KB

eda.py 12KB

scale.py 4KB

callback_list.py 1KB

callback.py 592B

metric_logger.py 2KB

validation_step.py 1KB

sklearn.py 5KB

__init__.py 0B

requires.txt 273B

random_parameters.py 564B

validator_with_dataset.py 1KB

PKG-INFO 17KB

importance.py 3KB

共 86 条

挣扎的蓝藻

粉丝: 14w+
资源: 15万+

Python机器学习库mljar-supervised 0.7.4发布

用于表格数据的自动机器学习（AutoML）python软件包。 它可以处理：二进制分类，多类分类和回归。 它提供了解释和降价报告。-Python开发

在mljar监督下：通过特征工程和超参数调整使机器学习管道自动化

Python库 | infercode-0.0.7.tar.gz

你能用表格来表示SVM,TSVM,TBSVM,LSTSVM,CTSVM之间的联系和区别吗

python active_sampling/generate_random_supervised_seed_yolo.py --dataset_name 'coco_2017_train' --random_seeds 0,1,2,3,4,5,6,7,8,9 --random_file ./data_processing/COCO_supervision.txt --random_percent 10.0 --output_file ./dataseed/COCO_supervision_10.json

深度学习中有哪些算法分类

人工智能会用到的常见英文以及对应的中文

DSL: Dense Learning based Semi-Supervised Object Detection代码复现教程

时序判别器（Supervised Discriminator）和时间判别器（Temporal Discriminator）说明TimeGAN模型中有两个判别器？可以给出包含所有组件运行原理的逻辑图吗

The Support Vector Machines classifier Arguments: C -- penalty term kernel -- kernel function e.g. lambda x, y: ...

最新资源

用于表格数据的自动机器学习（AutoML）python软件包。它可以处理：二进制分类，多类分类和回归。它提供了解释和降价报告。-Python开发