近期在学TiDB课程,下面是所看视频的链接;TiDB快速起步课程视频地址
1.数据库、大数据发展历史与趋势关系数据库->nosql(大部分对于事务无法支持,而事务对于OLTP【即在线业务】是不可或缺的)->newsql(支持事务,且兼容多种数据模型的可扩展需求)
2006年谷歌的三驾马车GFS、Bigtable、Mapreduce开启了大数据时代。
分布式系统发展的内在原因:
1.分布式系统数据爆发增长的刚需;
2.经济原因;使用相对廉价机器的组合形成的分布式系统,除了可以获得超过CPU发展速度的性能外,并且具有更好的弹性,可以根据需要进行增加或者减少机器的数目。从2008年后,数据及其背后的计算需求,呈现了爆发性的增长,并且在可以预测的未来还会加速,基于此2008年后分布式系统在工业界逐渐涌现了很多产品。
分布式系统定义:
分布式系统是一种其组件位于不同的联网计算机上的系统,然后通过互相传递消息来进行通信和协调,为了达到共同的目标。这些组件会相互作用。----维基百科
谷歌的三驾马车
2006年谷歌的三驾马车GFS、Bigtable、Mapreduce开启了大数据时代。
GFS解决了分布式文件系统问题;
Bigtable解决了分布式Key-Value存储问题;
Mapreduce解决了在分布式文件系统和在分布式KV存储上如何做分布式计算和分布式分析的问题。
分布式系统关键挑战:
分治与协助、全局一致性、故障扩大、分区容错。
CAP理论
一个分布式系统里面,最多只能同时满足一致性、可用性、分区容错性这三项中的两项。
一致性:所有节点在同一时间的数据完全一致。
可用性:服务在正常响应时间内的可用。
分区容错性:分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性或可用性的服务。
关系型模型与事务
NewSQL
小结



