- 自动驾驶算法与芯片设计
- 任建峰 蒋立源 余成文
- 189字
- 2022-08-16 16:48:17
1.4.1 GPU
NVIDIA PX2平台是当前领先的基于GPU的自动驾驶解决方案。每个PX2都包含两个Tegra SoC和两个Pascal图形处理器。每个GPU都有专用的内存,以及用于DNN加速的专用指令。为了提供高吞吐量,每个Tegra都使用PCI-E Gen 2×4总线直接连接到Pascal GPU(总带宽为4.0GB/s)。此外,双CPU-GPU集群通过千兆以太网连接,可提供70GB/s的速度。通过优化的I/O架构和DNN加速,每个PX2每秒可以执行24万亿次深度学习计算。在运行AlexNet深度学习工作负载时,每秒可以转换2800张图像。