1. 首先获得n值 n = sqrt(memory * 1024 * 1024 / 8) # memory MB 2. 拿到机器的理论峰值p # 单位 G/s p = cyclenum * 流水线 * 处理字长 * 是否是fma 3. 计算出时间t # 单位是s t = (2/3 * n^3 + 2 * n^2) / (p * efficiency) / 10^9

1. 首先获得n值 n = sqrt(memory * 1024 * 1024 / 8) # memory MB 2. 拿到机器的理论峰值p # 单位 G/s p = cyclenum * 流水线 * 处理字长 * 是否是fma 3. 计算出时间t # 单位是s t = (2/3 * n^3 + 2 * n^2) / (p * efficiency) / 10^9