Halo
发布于 2024-06-12 / 158 阅读 / 0 评论 / 0 点赞

算力

算力单位

在谈论算力的时候,人们常用“P”计算:

  • 1P=1024T = 10^{12}
  • 1T=1024G = 10^{9}
  • 1G=1024M = 10^{6}
  • 1M=1024k = 10^{3}
  • 算力单位每秒浮点运算次数FLOPS,根据浮点数的不同,可以分为FP16、FP32单精度和FP64双精度,通常记为xxxFLOPS(FP16)、0.5xxxFLOPS(FP32)、0.25xxxFLOPS(FP64)

单个cpu算力估算

  • 计算公式:算力(FLOPS) = CPU核心数 x 时钟频率 x 单个周期浮点计算能力
  • 单个周期浮点计算能力(FP32) = AVX-512 FMA 单元数 x FMA系数 x 2(同时加法和乘法) / 32 = 512 x FMA系数 x 2 / 32
    英特尔® 至强® Gold 6348 处理器,28c,2.60 GHz,42M 高速缓存, TDP 235w:
    查询得:单个周期浮点计算能力(FP32) = 512 x 2(FMA系数) x 2(同时加法和乘法) /32 =64
    6348 算力(FP32) = 28 x 2.6 x 10^9 x 64 / 10^{12} = 4.6 TFLOPS

算力分类

通用算力(General-Purpose Computing Power)

一般指CPU算力,传统的中央处理单元,适用于广泛的计算任务,包括日常办公、网页浏览、轻量级数据处理等

智能算力(Intelligent Computing Power)

  1. GPU算力,图形处理单元,特别适用于需要大量并行处理的任务,如深度学习、图像和视频处理
  2. TPU算力,张量处理单元,为机器学习任务优化,提供高效的AI计算能力。
  3. AI加速器,如神经网络处理器(NPU)、深度学习加速器等,专门设计用于加速AI算法。

超算算力(Supercomputing Power)

  1. 超级计算机,由大量高性能处理器(CPU/GPU/TPU等)组成,用于执行极其复杂的科学计算和大规模数据处理
  2. 高性能计算集群(HPC),由多个高性能节点组成的计算集群,通常用于科研、工程设计、气候模拟等
  3. 异构计算,结合不同类型的处理器(如CPU、GPU、FPGA、ASIC等)以优化特定计算任务的性能

评论