我猜半精度算术(float16)必须由numpy“模仿”,因为在底层C语言(以及适当的处理器指令)中没有相应的类型。另一方面,使用本机数据类型可以非常有效地完成单精度(float32)和双精度(float64)操作。
从单精度运算的良好性能开始:现代处理器具有用于矢量化浮点算术(例如AVX)的有效单元,因为它还需要良好的多媒体性能。

我猜半精度算术(float16)必须由numpy“模仿”,因为在底层C语言(以及适当的处理器指令)中没有相应的类型。另一方面,使用本机数据类型可以非常有效地完成单精度(float32)和双精度(float64)操作。
从单精度运算的良好性能开始:现代处理器具有用于矢量化浮点算术(例如AVX)的有效单元,因为它还需要良好的多媒体性能。