人工智能边缘计算异构计算机平台
许多行业都在追求人工智能,希望通过更先进的自动化和机器学习来提升自己的业务。现今有无数的例子,包括制造商尝试使用具有人工智能的机器视觉系统来进行缺陷分类,以及使用具有人工智能的光学字符识别从老旧设备中采集数据。然而,人工智能仍处于起步阶段,硬件和软件解决方案的复杂性和多样性可能会让人难以应付。 为了获得最佳的解决方案,系统架构工程师首先需要决定是否需在传感器附近(例如边缘侧)或在云端进行大量的人工智能演算。若再加上性能、大小、重量和功耗 (SWaP) 等需求,则会影响到决定该解决方案的方向。为了实现人工智能边缘计算性能的最大化, 最佳的解决方案通常会使用异构计算平台,也就是会有两种或两种以上不同类型的计算核心, | 例如: ● 通用型 CPU ● 现场可编程逻辑门阵列 (FPGA) ● 图形处理单元 (GPU) ● 特殊应用集成电路 (ASIC)
|
| |
| |
在设计人工智能平台时,系统架构工程师应该考虑使用异构计算架构,交互运用多种核心类型,包括 CPU、GPU、FPGA 和 ASIC。同一科技的目标是在最适合的核心上运行人工智能计算,与同类平台相比,可以更快速地计算并降低特定功能的耗电量。 尽管开发异构平台要比同类平台复杂,但同一科技简化了设计过程来提供混合核心的异构平台,如图 1 所示。系统架构工程师可以根据人工智能计算的需求,配置同一科技的平台,减少开发工作,并从这种可扩展的解决方案中获益。 |
图 1 同一科技面向人工智能应用的异构架构选择 |
针对用于处理人工智能计算的不同核心类型,以下简要概述了其优劣势。表 1 提供了其它相关信息。 • 通用型 CPU 通常,每个人工智能平台都有一个 CPU 来管理平台运行以及功能丰富的应用程序,可能还有一个用户接口。此外,CPU 可以有效地处理不同格式的数据(例如,影片、文本、图片等)、提取、转换和加载 (ETL) 程序。 • 图形处理单元 (GPU) GPU 是一种高度任务并行、专门用于图形处理的核心,其架构非常适合人工智能计算。通过使用成百上千个小核心来执行复杂的数学和统计计算,GPU 可以同时进行深度神经网络 (DNNs) 的学习和推理;但是,GPU 占用空间大,功耗也高。 • 现场可编程逻辑门阵列(FPGA) FPGA 具有可编辑的逻辑门,可以为特定的应用进行编程设定;还可根据需求,在现场重新修改程序,从而提供高度的灵活性。 • 特殊应用集成电路 (ASIC) ASIC 是专为特定应用而设计的定制逻辑芯片。这些核心可以快速执行复杂性和重复性的计算,但是它们的设计成本昂贵(一次性的工程开发成本很高),并且耗时(一到两年)。 • 视觉处理器 (VPU) VPU 是适用于计算机视觉和图像处理的定制化 ASIC,其功耗低、内存占用少。适合于已学习过的模型,不太适合学习本身,比如机器学习。 • 张量处理器 (TPU) 是 Google 第一款用于边缘核神经网络计算(如推理)的 TPU。采用客制化的 ASIC 专用芯片,能有效进行效能优化,为 Google 的深度学习框架 TensorFlow 而设计。 | |
表 1 人工智能应用中的核心类型比较 | |
| |
图 2 同一科技致力于协助系统架构工程师在边缘侧的异构计算平台上运行人工智能应用
| |
图 3. 同一科技异构计算平台由 基于 GPU 和VPU 的板卡、系统和服务器产品组成 | |
。 | |