大数据java面试题
时间: 2023-11-09 22:05:17 浏览: 209
好的,我知道了。那么,你的问题是:
什么是大数据?大数据有哪些特点?
大数据是指数据量巨大、类型多样、处理速度快、价值密度低的数据集合。大数据的特点包括以下几个方面:
1. 数据量大:大数据的数据量通常以TB、PB、EB等计量单位,远远超过传统数据处理能力。
2. 处理速度快:大数据处理需要高效的计算和存储技术,以保证数据的实时性和准确性。
3. 数据类型多样:大数据包含结构化、半结构化和非结构化数据,如文本、图像、音频、视频等。
4. 价值密度低:大数据中包含了很多无用信息,需要通过数据挖掘等技术进行筛选和分析,提取有价值的信息。
5. 数据来源广泛:大数据来自于各种渠道,如社交媒体、传感器、移动设备等。
6. 数据质量不确定:大数据中存在着很多错误、重复和不完整的数据,需要进行清洗和预处理。
7. 数据安全性要求高:大数据中包含着很多敏感信息,如个人隐私、商业机密等,需要采取安全措施保护。
相关问题
美团 大数据开发面试题
引用:面试是双方相互了解的过程,所以出于礼貌在面试结束询问一下你有没有什么想问的。当然面试官也想借此了解你对他们公司的了解程度及感兴趣程度。引用:自我介绍写一个单例模式(整个过程挺让人不舒服的,一直在用训斥的语气说话)面试官口述一道题:两个自然数相加,这两个自然数可能会非常大(就是大数a b),体验也很差,我写完之后,因为没有测试用例(他口述的题目,没法提交验证),我就随便写了两个例子试了一下,他就说:你写这么多行代码,就用这么几个用例测试吗(训斥的口吻),最好还是提示了一下,后面的while循环没有测,反正最后是写出来了MySQL用过么,它的索引用什么结构实现的(B 树)B 树除了查询稳定,还有其他的优势吗(更适合范围查询)B和B 树的核心区别(答了非叶子节点的区别)怎么看一个SQL需要优化的地方场景图:给一道SQL,问怎么建索引,大概是:select orz,dt,ort from tb where dt >= '2021-10-03' and dt <= '2021-10-25' and/or ort in (4,5,6)ort的连接条件我记不清是and还是or了。我说建联合索引(dt和rt),他问谁在前谁在后,我说应该是dt吧(因为我真不会,我是感觉这俩前后是无所谓的),希望有大佬可以解答一下Java的动态代理(我只记得反射了)(总感觉自己在面后端,不是大数据)聊了一下最新的我在做的项目(给国能做的知识图谱的),聊了挺多的,这个时候气氛才拉回来经典反问。
引用:2、声明粒度 从关注原子粒度开始设计,也就是从最细粒度开始,因为原子粒度能够承受无法预期的用户查询。但是上卷汇总粒度对查询性能的提升很重要的,所以对于有明确需求的数据,我们建立针对需求的上卷汇总粒度,对需求不明朗的数据我们建立原子粒度。
根据提供的引用内容,美团大数据开发面试题主要包括以下几个方面:
1. 单例模式的实现:请写出一个单例模式的代码实现。
2. 大数相加:实现两个可能非常大的自然数相加的代码,注意考虑性能和测试用例。
3. MySQL索引:讨论MySQL索引的实现机制和优势,以及如何根据SQL语句建立索引。
4. Java动态代理:解释Java动态代理的概念和使用场景。
5. 项目经验:讨论面试者最新做的项目,例如知识图谱的开发经验。
6. 声明粒度:探讨数据设计中声明粒度的重要性和应用场景。
阅读全文