算力单位
在谈论算力的时候,人们常用“P”计算:
- 1P=1024T = 10^{12}
- 1T=1024G = 10^{9}
- 1G=1024M = 10^{6}
- 1M=1024k = 10^{3}
- 算力单位每秒浮点运算次数FLOPS,根据浮点数的不同,可以分为FP16、FP32单精度和FP64双精度,通常记为xxxFLOPS(FP16)、0.5xxxFLOPS(FP32)、0.25xxxFLOPS(FP64)
单个cpu算力估算
- 计算公式:算力(FLOPS) = CPU核心数 x 时钟频率 x 单个周期浮点计算能力
- 单个周期浮点计算能力(FP32) = AVX-512 FMA 单元数 x FMA系数 x 2(同时加法和乘法) / 32 = 512 x FMA系数 x 2 / 32
英特尔® 至强® Gold 6348 处理器,28c,2.60 GHz,42M 高速缓存, TDP 235w:
查询得:单个周期浮点计算能力(FP32) = 512 x 2(FMA系数) x 2(同时加法和乘法) /32 =64
6348 算力(FP32) = 28 x 2.6 x 10^9 x 64 / 10^{12} = 4.6 TFLOPS
算力分类
通用算力(General-Purpose Computing Power)
一般指CPU算力,传统的中央处理单元,适用于广泛的计算任务,包括日常办公、网页浏览、轻量级数据处理等
智能算力(Intelligent Computing Power)
- GPU算力,图形处理单元,特别适用于需要大量并行处理的任务,如深度学习、图像和视频处理
- TPU算力,张量处理单元,为机器学习任务优化,提供高效的AI计算能力。
- AI加速器,如神经网络处理器(NPU)、深度学习加速器等,专门设计用于加速AI算法。
超算算力(Supercomputing Power)
- 超级计算机,由大量高性能处理器(CPU/GPU/TPU等)组成,用于执行极其复杂的科学计算和大规模数据处理
- 高性能计算集群(HPC),由多个高性能节点组成的计算集群,通常用于科研、工程设计、气候模拟等
- 异构计算,结合不同类型的处理器(如CPU、GPU、FPGA、ASIC等)以优化特定计算任务的性能