1、分布式与集群的共同点与区别?
共同的:分布式和集群都是多台机器
区别:分布式每个服务器上的系统都是不一样的,但是集群是一致的(百度主页)
2、负载均衡是什么?
1把负载(工作任务)进行平衡、分摊到多个操作单元上进行运行
2解决单个无法处理所有任务,多个一起处理的问题
3、故障转移是什么?
单点故障是一个服务器出问题
1活动服务或应用意外终止,快速启用冗余或备用的服务器、系统、硬件或者网络接替他们工作
2又称为容错系统,指的是可以容忍错误的发生
3核心是设置备份,出现故障主备切换
4前提是数据状态保持一致
4、伸缩性是什么?
1弹性,可扩展性
2系统可以根据需求动态的扩容、缩容(例如双十一)
5、Hadoop核心组件
HDFS(分布式文件存储系统)解决海量数据存储
YARN(集群资源管理和任务调度框架)解决资源任务调度
MapReduce(分布式计算框架)解决海量数据计算
6、Hadoop特性优点
扩容能力强:在可用的计算机集群间分配数据并完成计算任务,这些集群可以方便的扩展到数以千计的节点中
成本低:通过普通廉价的机器组成服务器集群来分发以及处理数据,所以成本很低
效率高:并发数据,可以在节点之间动态并行的移动数据
可靠性强:能自动维护数据的多份复制,并且任务失败之后可以自动重新部署计算任务



