명령행 도구
FuriosaAI SDK는 NPU 디바이스 정보를 출력 하거나 모델 컴파일, 모델과 SDK 간의 호환성 확인 등의 기능을 명령행 도구로 제공한다. 이 섹션에서는 각 명령형 도구 별 설치 방법과 사용 방법에 대해 설명한다.
furiosa-toolkit
furiosa-toolkit
은 NPU 장치를 관리하고 정보를 확인하는 명령형 도구를 제공한다.
furiosa-toolkit 설치
이 명령형 도구 사용을 위해서는 사전에 드라이버, 펌웨어, 런타임 설치 가이드 를 따라 커널 드라이버를 설치해야 한다. 그 이후에는 아래 설명을 따라 furiosa-toolkit 을 설치한다.
sudo apt-get install -y furiosa-toolkit
furiosactl 사용법
furiosactl 커맨드는 다양한 서브 커맨드를 제공하고 장치의 정보를 얻거나 제어하는 기능을 가지고 있다.
문법 개요:
furiosactl <sub command> [option] ..
furiosactl info
info
서브 커맨드를 통해 머신이 인식한 NPU 장치의 정보를 확인할 수 있다.
이 명령은 NPU 장치의 온도, PCI 정보 등을 출력한다. 만약 머신에 장치를 장착한 후에도 장치가 이 명령으로 보이지 않는다면,
드라이버, 펌웨어, 런타임 설치 가이드 를 따라 드라이버 설치해야 한다.
info
커맨드와 함께 --full
옵션을 추가하면 장치의 UUID, Serial Number 정보를 함께 확인할 수 있다.
$ furiosactl info
+------+--------+----------------+-------+--------+--------------+
| NPU | Name | Firmware | Temp. | Power | PCI-BDF |
+------+--------+----------------+-------+--------+--------------+
| npu1 | warboy | 1.6.0, 3c10fd3 | 54°C | 0.99 W | 0000:44:00.0 |
+------+--------+----------------+-------+--------+--------------+
$ furiosactl info --full
+------+--------+--------------------------------------+-------------------+----------------+-------+--------+--------------+---------+
| NPU | Name | UUID | S/N | Firmware | Temp. | Power | PCI-BDF | PCI-DEV |
+------+--------+--------------------------------------+-------------------+----------------+-------+--------+--------------+---------+
| npu1 | warboy | 00000000-0000-0000-0000-000000000000 | WBYB0000000000000 | 1.6.0, 3c10fd3 | 54°C | 0.99 W | 0000:44:00.0 | 511:0 |
+------+--------+--------------------------------------+-------------------+----------------+-------+--------+--------------+---------+
furiosactl list
list
서브 커맨드는 NPU 장치에서 사용할 수 있는 device file의 정보를 제공한다.
NPU에 존재하는 각 코어가 사용 중인지 유휴 상태인지 여부를 확인할 수도 있다.
furiosactl list
+------+------------------------------+-----------------------------------+
| NPU | Cores | DEVFILES |
+------+------------------------------+-----------------------------------+
| npu1 | 0 (available), 1 (available) | npu1, npu1pe0, npu1pe1, npu1pe0-1 |
+------+------------------------------+-----------------------------------+
furiosactl ps
ps
서브 커맨드는 현재 NPU 장치를 점유하고 있는 OS 프로세스의 정보를 출력해준다.
$ furiosactl ps
+-----------+--------+------------------------------------------------------------+
| NPU | PID | CMD |
+-----------+--------+------------------------------------------------------------+
| npu0pe0-1 | 132529 | /usr/bin/python3 /usr/local/bin/uvicorn image_classify:app |
+-----------+--------+------------------------------------------------------------+
furiosactl top
(experimental)
top
서브 커맨드는 시간의 흐름에 따른 NPU 장치 별 사용률을 확인하는데 사용한다.
출력 항목은 다음의 의미를 나타낸다.
기본적으로 1초 간격으로 사용률을 계산하지만, --interval
옵션을 통해 계산 주기를 직접 설정할 수 있다. (단위: ms)
항목 |
설명 |
---|---|
Datetime |
관측 시각 |
PID |
NPU를 사용 중인 프로세스ID |
Device |
사용 중인 NPU 장치 |
NPU(%) |
관측 시간동안 NPU가 사용된 시간의 비율 |
Comp(%) |
NPU가 사용된 시간 중 연산에 사용된 시간의 비율 |
I/O(%) |
NPU가 사용된 시간 중 I/O에 사용된 시간의 비율 |
Command |
프로세스의 실행 명령행 |
$ furiosactl top --interval 200
NOTE: furiosa top is under development. Usage and output formats may change.
Please enter Ctrl+C to stop.
Datetime PID Device NPU(%) Comp(%) I/O(%) Command
2023-03-21T09:45:56.699483936Z 152616 npu1pe0-1 19.06 100.00 0.00 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:56.906443888Z 152616 npu1pe0-1 51.09 93.05 6.95 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:57.110489333Z 152616 npu1pe0-1 46.40 97.98 2.02 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:57.316060982Z 152616 npu1pe0-1 51.43 100.00 0.00 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:57.521140588Z 152616 npu1pe0-1 54.28 94.10 5.90 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:57.725910558Z 152616 npu1pe0-1 48.93 98.93 1.07 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:57.935041998Z 152616 npu1pe0-1 47.91 100.00 0.00 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
2023-03-21T09:45:58.13929122Z 152616 npu1pe0-1 49.06 94.94 5.06 ./npu_runtime_test -n 10000 results/ResNet-CTC_kor1_200_nightly3_128dpes_8batches.enf
furiosa
furiosa
커맨드는 Python SDK 를 설치하면 사용할 수 있는 메타 명령형 도구이다.
또한 확장 패키지를 설치하면 추가 하위 커맨드(subcommand) 가 추가 된다.
만약 Python 실행 환경이 준비되어 있지 않다면 Python 실행 환경 구성 를 참고한다.
명령행 도구 설치
$ pip install furiosa-sdk
설치 확인
$ furiosa compile --version
furiosa-compiler: 0.9.0 (rev: e626c458c built at 2023-04-19T13:57:11Z)
furiosa-tools: 0.9.0-release (rev: 474835a)
furiosa compile
compile
명령은 TFLite, ONNX
형식의 모델을 컴파일하여 FuriosaAI NPU를 사용하는 프로그램을 생성한다.
자세한 설명과 옵션은 furiosa compile 페이지에서 찾을 수 있다.
furiosa litmus (모델 적합 여부 검사)
litmus
명령은 TFLite, ONNX 모델을 인자로 받아,
자동으로 양자화한 후 최종 바이너리까지 컴파일을 시도하여 주어진 모델이 SDK와 호환되는지 검사한다.
$ furiosa litmus foo.onnx
libfuriosa_hal.so --- v0.11.0, built @ 43c901f
INFO:furiosa.common.native:loaded native library libfuriosa_compiler.so.0.9.0 (0.9.0 e626c458c)
furiosa-quantizer 0.9.0 (rev. 474835a) furiosa-litmus 0.9.0 (rev. 474835a)
[Step 1] Checking if the model can be loaded and optimized ...
[Step 1] Passed
[Step 2] Checking if the model can be quantized ...
[Step 2] Passed
[Step 3] Checking if the model can be saved as a file ...
[Step 3] Passed
[Step 4] Checking if the model can be compiled for the NPU family [warboy-2pe] ...
[1/5] 🔍 Compiling from dfg to ldfg
▪▪▪▪▪ [1/3] Splitting graph(LAS)...Done in 7.1025434s
▪▪▪▪▪ [2/3] Lowering graph(LAS)...Done in 17.59427s
▪▪▪▪▪ [3/3] Optimizing graph...Done in 0.022468261s
Done in 24.721376s
[2/5] 🔍 Compiling from ldfg to cdfg
Done in 0.002730215s
[3/5] 🔍 Compiling from cdfg to gir
Done in 0.018330544s
[4/5] 🔍 Compiling from gir to lir
Done in 0.004659492s
[5/5] 🔍 Compiling from lir to enf
Done in 0.026905483s
✨ Finished in 24.77446s
[Step 4] Passed
실패하는 경우 아래와 같은 오류를 볼 수 있으며 오류가 발생한 경우 메시지를 FuriosaAI 고객지원 센터 에 버그 신고(Bug Report) 섹션 보고하여 지원을 받을 수 있다.
$ furiosa litmus bar.onnx
libfuriosa_hal.so --- v0.11.0, built @ 43c901f
INFO:furiosa.common.native:loaded native library libfuriosa_compiler.so.0.9.0 (0.9.0 e626c458c)
furiosa-quantizer 0.9.0 (rev. 474835a) furiosa-litmus 0.9.0 (rev. 474835a)
[Step 1] Checking if the model can be loaded and optimized ...
[Step 1] Failed
Traceback (most recent call last):
File "/.../python-3.10.6/bin/furiosa-litmus", line 8, in <module>
sys.exit(main())
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/litmus/__init__.py", line 172, in main
validate(Path(args.model_path), verbose=args.verbose, target_npu=args.target_npu)
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/litmus/__init__.py", line 121, in validate
raise e
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/litmus/__init__.py", line 115, in validate
onnx_model = optimize_model(onnx_model)
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/optimizer/frontend/onnx/__init__.py", line 24, in optimize_model
model = _transform([CheckVersion(opset_version).transform], model)
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/optimizer/frontend/onnx/__init__.py", line 37, in _transform
model = transform(model)
File "/.../python-3.10.6/lib/python3.10/site-packages/furiosa/optimizer/frontend/onnx/utils/version_checker.py", line 26, in transform
version = int(model.opset_import[0].version)
IndexError: list index (0) out of range