大数据和NoSQL技术概述
版权申诉
93 浏览量
更新于2024-07-02
收藏 2.6MB PPTX 举报
大数据与NOSQL概述
大数据概述
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
大数据的4V特征
大数据的4V特征是指大数据的四个关键特征:
* Volume(海量):数据量巨大,对TB、PB数据级的处理,已经成为基本配置。
* Variety(多样):处理多样性的数据类型,结构化数据和非结构化数据,能处理Web数据,能处理语音数据甚至是图像、视频数据。
* Velocity(实时):在客户每次浏览页面,每次下订单的过程中都存在,都会需要对用户进行实时的推荐,决策已经变得实时。
* Value(价值):价值密度低,商业价值高。一条数小时的监控视频,可能有用的数据仅有一两秒。能从海量数据中发掘出这些数据,将成为企业竞争力的重要来源。
大数据的系统需求
大数据的系统需求包括:
* 高性能(High-performance):高新能、高并发读写、实时动态获取和更新数据。
* 海量存储(Huge Storage):海量数据的高效率存储和访问。
* 高可扩展性和高可用性(High Scalability && High Availability):需要拥有快速横向扩展能力,能提供7*24小时不间断服务。
大数据的典型架构
大数据的典型架构包括:
* 数据计算用时对比:离线计算 > 流式计算 > 实时计算
* 数据处理架构:数据采集、数据存储、数据处理、数据分析等
NOSQL概述
NOSQL(Not Only SQL)是指不仅仅是SQL的数据库管理系统,它拥有更加灵活的数据模型和更加高效的数据存储和检索机制。
NOSQL的优势和不足
NOSQL的优势包括:
* 高性能:NOSQL数据库可以处理高并发读写和大规模数据。
* 高可扩展性:NOSQL数据库可以水平扩展,满足大规模数据存储和处理的需求。
* 高灵活性:NOSQL数据库可以处理多样性的数据类型和结构化数据。
NOSQL的不足包括:
* 数据一致性问题:NOSQL数据库可能会出现数据一致性问题,需要进行特殊处理。
* 数据安全问题:NOSQL数据库可能会出现数据安全问题,需要进行特殊处理。
NOSQL的CAP理论实现
NOSQL的CAP理论实现是指NOSQL数据库在可用性、数据一致性和分区容忍性之间的trade-off关系。
NOSQL数据模型及分类
NOSQL数据模型包括:
* 键值型数据库(Key-Value Database):如Redis、Riak等。
* 文档型数据库(Document-oriented Database):如MongoDB、CouchDB等。
* 列存储数据库(Column-oriented Database):如HBase、Cassandra等。
* 图数据库(Graph Database):如Neo4j、OrientDB等。
大数据与NOSQL概述全文共23页,当前为第23页。
2021-09-21 上传
2021-11-24 上传
2024-05-29 上传
2021-12-04 上传
2022-11-23 上传
2024-05-20 上传
2021-10-12 上传
2021-10-14 上传
2021-09-23 上传
是空空呀
- 粉丝: 189
- 资源: 3万+
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫