TiDB快速起步_大数据系统

TiDB快速起步

前言

近期在学TiDB课程，下面是所看视频的链接；TiDB快速起步课程视频地址

1.数据库、大数据发展历史与趋势

关系数据库->nosql(大部分对于事务无法支持，而事务对于OLTP【即在线业务】是不可或缺的)->newsql（支持事务，且兼容多种数据模型的可扩展需求）

2006年谷歌的三驾马车GFS、Bigtable、Mapreduce开启了大数据时代。

2. 分布式关系数据库的发展

分布式系统发展的内在原因：
1.分布式系统数据爆发增长的刚需；
2.经济原因；使用相对廉价机器的组合形成的分布式系统，除了可以获得超过CPU发展速度的性能外，并且具有更好的弹性，可以根据需要进行增加或者减少机器的数目。从2008年后，数据及其背后的计算需求，呈现了爆发性的增长，并且在可以预测的未来还会加速，基于此2008年后分布式系统在工业界逐渐涌现了很多产品。

分布式系统定义：
分布式系统是一种其组件位于不同的联网计算机上的系统，然后通过互相传递消息来进行通信和协调，为了达到共同的目标。这些组件会相互作用。----维基百科

谷歌的三驾马车
2006年谷歌的三驾马车GFS、Bigtable、Mapreduce开启了大数据时代。
GFS解决了分布式文件系统问题；
Bigtable解决了分布式Key-Value存储问题；
Mapreduce解决了在分布式文件系统和在分布式KV存储上如何做分布式计算和分布式分析的问题。

分布式系统关键挑战：
分治与协助、全局一致性、故障扩大、分区容错。

CAP理论
一个分布式系统里面，最多只能同时满足一致性、可用性、分区容错性这三项中的两项。

一致性：所有节点在同一时间的数据完全一致。
可用性：服务在正常响应时间内的可用。
分区容错性：分布式系统在遇到某节点或网络分区故障的时候，仍然能够对外提供满足一致性或可用性的服务。

关系型模型与事务

NewSQL

小结

3. TiDB产品与开源社区演进、TiDB整体概述 4.我们到底需要一个什么样的数据库

5. 如何构建一个分布式存储系统 6. 如何构建一个分布式SQL引擎、新一代HTAP数据库选型 7. 基于分布式架构的HTAP数据库 8. TIDB关键数据创新 9. TIDB典型应用场景及用户案例与TIDB初体验 10. TIDB初体验

TiDB快速起步

大数据系统相关栏目本月热门文章