NPU 가속 지원 연산자 목록

FuriosaAI NPU와 SDK 에서는 Tensorflow Lite 모델과 ONNX 가 지원하는 아래 연산자들을 가속할 수 있다. 연산자 이름은 ONNX 를 기준으로 한다.

참고

NPU 가속을 지원하지 않는 경우에는 CPU에서 동작하게 된다. 또한 NPU 가속을 지원하는 일부 연산자는 특정 조건을 만족하지 않을 경우 다수의 연산자로 분할되어 동작하거나 CPU 에서 동작할 수 있다. 모델의 가중치가 NPU 메모리 보다 크거나 NPU의 메모리로 특정 연산을 처리하기에 부족한 경우가 한 가지 예이다.

NPU 가속 지원 연산자
연산자 이름	추가 설명
Add
AveragePool
BatchNormalization	Conv 다음에 있는 경우에 한하여 가속 지원
Clip
Concat	height 축에 대해서만 지원
Conv	group <= 128, dilation <= 12 인 경우에 대해 지원
ConvTranspose
DepthToSpace
Exp
Expand
Flatten
Gemm
LeakyRelu
LpNormalization	p = 2 인 경우에 한하여 지원
MatMul
MaxPool
Mean
Mul
Pad
ReduceL2
ReduceSum
Relu
Reshape
Pow
SpaceToDepth	0.6.0 이상 버전에서 mode=”CRD” 인 경우에 지원
Sigmoid
Slice	height 축에 대해서만 지원
Softmax
Softplus
Sub
Split
Sqrt
Transpose
Unsqueeze