NPU 가속 지원 연산자 목록

FuriosaAI NPU와 SDK 에서는 Tensorflow Lite 모델과 ONNX 가 지원하는 아래 연산자들을 가속할 수 있다. 연산자 이름은 ONNX 를 기준으로 한다.

참고

NPU 가속을 지원하지 않는 경우에는 CPU에서 동작하게 된다. 또한 NPU 가속을 지원하는 일부 연산자는 특정 조건을 만족하지 않을 경우 다수의 연산자로 분할되어 동작하거나 CPU 에서 동작할 수 있다. 모델의 가중치가 NPU 메모리 보다 크거나 NPU의 메모리로 특정 연산을 처리하기에 부족한 경우가 한 가지 예이다.

NPU 가속 지원 연산자

연산자 이름

추가 설명

Add

AveragePool

BatchNormalization

Conv 다음에 있는 경우에 한하여 가속 지원

Clip

Concat

height 축에 대해서만 지원

Conv

group <= 128, dilation <= 12 인 경우에 대해 지원

ConvTranspose

DepthToSpace

Exp

Expand

Flatten

Gemm

LeakyRelu

LpNormalization

p = 2 인 경우에 한하여 지원

MatMul

MaxPool

Mean

Mul

Pad

ReduceL2

ReduceSum

Relu

Reshape

Pow

SpaceToDepth

0.6.0 이상 버전에서 mode=”CRD” 인 경우에 지원

Sigmoid

Slice

height 축에 대해서만 지원

Softmax

Softplus

Sub

Split

Sqrt

Transpose

Unsqueeze