去年学长的链接2020年大数据基础
判断10道,基本都比较简单
比如:
大数据就是1T以上的数据
大数据技术框架是否都是并行计算的
- 阐述NoSql ,NewSql, 传统关系型数据库的关联联系和区别
- 分析亚线性空间算法,应该从哪几个方面入手
- 手撕矩阵乘法的Mapreduce
- 还有一个不记得了,呜呜
- 在Hardoop框架里面,Job与Task的关联和联系
- 给你一个整数集合,设计并行算法,求平均数。
- 设计L1点查询算法
- 分析1里面的算法的空间复杂度,以及近似比
- 如果要有效合并AB两个数据流里面的结果,应该设计什么数据结构以及算法(很显然CountSketch呀)
背景:要你对工业时序数据设计实时异常值检测以及存储管理系统
(笔者当时就往Storm以及Hbase上面靠了。)
- 实时计算系统的计算框架
- 实时计算系统的数据结构
- 数据存储系统应该面临哪些设计要求。
- 如果考虑到较新的数据读的较快的查询请求,以及查询主要是点查询以及范围查询,你会怎么去设计背后的数据存储系统 。



