大搜车金融业务中HBase的应用与GPS风控实践

需积分: 5 0 下载量 107 浏览量 更新于2024-06-21 收藏 6.7MB PDF 举报
“藏经阁-HBase在大搜车金融业务中的应用实践.pdf”主要讲述了HBase在大搜车金融业务中的具体应用场景,包括业务介绍、数据大屏实践、GPS风控实践以及流式数据统计等内容。 1. **业务介绍**: 大搜车可能是一家涉及汽车金融业务的公司,利用大数据技术进行风险控制和业务决策。在这个场景中,HBase作为大数据存储的关键组件,服务于实时数据分析和展示。 2. **数据大屏实践**: - **车辆轨迹大屏**:通过车载GPS设备收集数据,经过GPS上报网关处理后,数据进入消息队列。然后,数据被送到数据仓库(如Hive)进行存储,同时部分数据存储在HBase(通过Phoenix进行查询)。数据网关负责将数据推送到大屏展示,如轨迹大屏。表`GPS.TRACES`设计了反向的DEVICE_ID+时间戳(TS)作为ROWKEY,便于按时间顺序检索。同时创建了索引ONGPS.TRACES,优化了地理位置(GPS_TIME,CITY_ID,VENDOR_ID)相关的查询性能。 - **实时成交大屏**:埋点日志数据通过MQ(消息队列)传递,消费者从中读取并处理,存入基础数据库(如MySQL的DIM表)和HBase(通过精卫工具)。成交大屏的数据表`TRD.TGC_ORDERS`使用订单ID的反向形式作为ROWKEY,存储了相关交易信息,并建立了索引ONGPS.TGC_ORDERS,优化了按时间、类型、地区等条件的查询。 3. **大屏性能优化**: - **WebSocket**:通过WebSocket替代HTTP请求,减少建立连接的时间,提高交互效率。同时,通过数据分片减少首次请求耗时,并且分离渲染线程与数据请求线程,确保用户界面的流畅性。 4. **GPS风控实践**: - **GPS风控业务系统**:GPS设备的上报数据通过上报网关处理,可能包括设备注册、里程纠偏等功能。数据进入HBase用于实时轨迹分析和风控模型构建。风控模型及规则引擎根据提取的特征进行预警和后台监控,如停留点分析、电子围栏和聚集分析。 - **聚集分析-GeoHash**:GeoHash是一种地理空间索引技术,通过Base32编码将地理坐标转化为字符串,便于高效地进行区域划分和距离计算。GeoHash将地球表面不断进行32等分,每个字符串对应一个特定区域。 5. **流式数据统计**: 虽然没有详细说明,但可以推测大搜车可能使用流处理技术(如Apache Flink或Spark Streaming)来实时处理和统计GPS数据,进行实时的风险评估和业务洞察。 HBase在大搜车金融业务中的应用主要体现在实时数据展示、风险控制和流式数据处理等方面,通过高效的数据存储和查询优化,支持业务的快速决策和智能化运营。