NPU 가속 지원 연산자 목록

FuriosaAI NPU와 SDK 에서는 Tensorflow Lite 모델과 ONNX 가 지원하는 아래 연산자들을 가속할 수 있다. 연산자 이름은 ONNX 를 기준으로 한다.

참고

NPU 가속을 지원하지 않는 경우에는 CPU에서 동작하게 된다. 또한 NPU 가속을 지원하는 일부 연산자는 특정 조건을 만족하지 않을 경우 다수의 연산자로 분할되어 동작하거나 CPU 에서 동작할 수 있다. 모델의 가중치가 NPU 메모리 보다 크거나 NPU의 메모리로 특정 연산을 처리하기에 부족한 경우가 한 가지 예이다.

NPU 가속 지원 연산자

연산자 이름

추가 설명

Add

AveragePool

BatchNormalization

Conv 다음에 있는 경우에 한하여 가속 지원

Clip

Concat

H axis 지원 (>= 0.6.0), C axis 지원 (>= 0.7.0)

Conv

group <= 128, dilation <= 12 인 경우에 대해 지원

ConvTranspose

DepthToSpace

CRD 모드 지원 (>= 0.6.0), DCR 모드 지원 (>= 0.7.0)

Exp

0.7.0 이상 부터 지원

Elu

0.7.0 이상 부터 지원

Erf

0.7.0 이상 부터 지원

Expand

Flatten

Gemm

Gelu

0.7.0 이상 부터 지원

LeakyRelu

Log

LpNormalization

p = 2 이고 batch <=2 인 경우에 한하여 지원

MatMul

MaxPool

Mean

Mul

Pad

CWH axis 지원 (>= 0.7.0)

ReduceL2

ReduceSum

Relu

Reshape

Resize

Linear, Nearest 모드 지원 (>= 0.7.0)

Pow

SpaceToDepth

CRD 모드 지원 (>= 0.6.0), DCR 모드 지원 (>= 0.7.0)

Sigmoid

Slice

H axis 지원 (>= 0.6.0), C axis 지원 (>= 0.7.0)

Softmax

batch <= 2 인 경우에 한해 지원

Softplus

Sub

Split

Sqrt

Tanh

0.7.0 이상 버전 부터 지원

Transpose

0.6.0 이상 버전 부터 지원

Unsqueeze