小米数据中台实践:销售数仓建设与应用优化

版权申诉
0 下载量 79 浏览量 更新于2024-03-05 收藏 3.86MB DOCX 举报
小米数据中台建设实践赋能业务增长 小米作为一家知名的科技公司,拥有庞大的销售数据,为了更好地管理和利用这些数据,小米进行了销售数仓的建设。在过去的独立数仓建设时期,小米的中国区、国际部等业务数据团队在进行不同的数仓建设,导致数据管理混乱,信息孤岛丛生。随着业务的飞速发展,小米决定进行统一的销售数仓建设,以实现数据的集中管理和高效利用。 在2019年前,小米的数仓建设是烟囱式的开发,各个业务部门独立建设数仓,导致数据孤立,难以进行整合分析。为了解决这一问题,小米集团技术委ABC(AI、Big data、Cloud)提出统一的数仓建设方针,以整合各业务部门的数据,并在2020年完成了离线销售数仓的建设,同时在筹备实时数仓的建设。到了2021年,实时数仓也建设完毕,进入了迭代优化和数据应用阶段。这标志着小米销售数仓建设迈入了新阶段,为后续的业务和技术升级提供了坚实的基础。 小米的销售数仓主要存放着整个公司的销售数据,包括订单数据、物流数据、门店数据、用户行为数据以及商品数据,并按照维度建模和规范进行高效的数据集合。销售数仓的数据主要来自于在线业务数据,如订单系统、商品中心、门店系统、售后系统和进销存系统,同时也包括一些日志采集数据。这些数据经过销售数仓的处理,被划分为不同的主题进行建设,实现了数据的整合和统一管理。 销售数仓还进行了元数据管理,旨在做到全域的元数据管理,以便更好地进行数据的归档、查询和利用。在数据应用层,销售数仓还提供了多种数据应用,以满足不同业务部门的需求,包括报表分析、数据挖掘和机器学习等,为业务决策提供了有力的支持。 总之,小米的销售数仓建设是从独立到统一,从离线到实时,经过多年的发展,已经成为小米业务增长的重要支撑。销售数仓的建设不仅解决了数据孤立和信息孤岛的问题,还为小米提供了高效的数据管理和利用方式,为业务发展提供了更为可靠的数据支持。在未来,小米将进一步完善销售数仓的建设,提升数据智能化水平,更好地赋能业务增长。
2024-09-05 上传
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行