评估思路
1.数据高峰期QPS计算,数据量/高峰期时长,根据二八法则
2.存储计算,考虑每天的数据总量包括原始数据量以及副本数据量,考虑数据保存时长以及高峰期QPS占集群总承载能力的百分比
3.磁盘数量计算,根据第二步计算物理机数量以及磁盘数量
4.磁盘类型选择,SSD or SAS,有钱直接SSD就行了
5.内存估算,资金充足时越大越好,kafka topic partition占用总内存除以物理机数量等于单台物理机需要的内存,考虑partition数据不需要完全放在内存中,20%就行了
6.CPU,资金充足时核数越多越好,kafka线程不到200个,一般16核就行了



