大数据驱动的信贷审批系统设计与实践

4星 · 超过85%的资源 需积分: 9 117 下载量 173 浏览量 更新于2024-07-20 1 收藏 4.82MB PDF 举报
“基于大数据的信贷审批系统 - 挖财资深架构师 - 曹静静 PPT内容” 本文主要探讨了如何构建一个基于大数据的信贷审批系统,以应对线上信贷业务的挑战。挖财作为一家全面的移动互联网金融平台,其信贷审批系统面临的关键问题包括如何利用大数据进行反欺诈和信用评分,以及如何设计高效审批核系统,同时在有限的人力下实现业务快速增长。 线上信贷业务相比传统信贷具有以下特点: 1. 用户量大,场景丰富,接入方式多样(H5, SDK, APP, API)。 2. 数据获取方式多样,数据种类丰富,格式复杂。 3. 贷中和贷后管理涉及多种贷款类型,审批需求强度高,自动化程度高。 4. 决策需实时反欺诈,快速迭代信用评级,以及高效的专家系统支持。 信贷系统架构经历了从外包阶段到自行研发再到输出阶段的演变: 1. 外包阶段:快速上线,但系统复杂,难以维护,集成和扩展困难。 2. 自行研发阶段:周期较长,但可定制需求,具有高扩展性,能更好地集成数据服务。 3. 输出阶段:引入权限控制,分享数据服务,并将非核心业务人员外包。 审批系统的智能化依赖于数据挖掘,通过人机混合决策,如Groovy和Drools规则引擎,实现更智能的审批决策。审批系统的设计重点在于如何有效利用大数据进行智能决策。 数据平台架构是审批系统的核心支撑,主要包含以下几个方面: 1. 数据种类:包括社交类、网银类、电商类、市政类等,覆盖了用户的多元信息。 2. 数据格式:包括结构化、半结构化和文本类数据,需要灵活处理不同数据类型。 3. 服务场景:涵盖了申请、审批、催收和分析建模等各个环节。 4. 数据管理:实现多源数据的导入导出,统一的Schema和类型系统,实时监控数据质量,以及根据需求选择不同的存储格式。 5. 服务分级:提供实时(<1秒)、准实时(<5分钟)和离线(>5分钟)的计算服务。 6. 计算框架:包括SQL-Based、Lambda Architecture、ML Pipeline和Storm等,满足不同计算需求。 大数据在信贷审批中的应用: 1. 数据来源多样化,包括人工录入、打标、聚类、图计算生成和三方批量导入。 2. 数据在贷前用于申贷过滤,贷中用于审批关联性标记,离线则用于模型训练。 3. 计算效率高,例如贷前实时计算能在500毫秒内完成。 总结,基于大数据的信贷审批系统旨在通过智能化手段提升审批效率和准确性,同时适应互联网业务的快速变化和大规模用户需求。这需要一套灵活、可扩展且能够深度挖掘数据价值的系统架构,以及对实时和离线计算的精确把握。通过这样的系统,金融机构可以更有效地评估风险,降低欺诈,优化用户体验,并推动业务的持续增长。