CatBoost 모델을 Tritron으로 서빙하기 위해서 모델을 변환해야 했는데, 그 때 알게된 ONNX에 대해 공부하다가 AI 모델 표준에 대해 찾게 됐다.
사실상 현재 ONNX가 AI 모델 표준으로 인정받고 있다고 하는데, 그 이전에 NNEF가 표준으로 제안된바 있다고 한다.
이 둘은 유사한 목표를 가지고 있지만 차이점이 있다고 해서 정리했다.
크게 1. 그래프 접근 방식, 2. 양자화된 네트워크 표현 방식, 3. 네트워크 표현 방식
이라고 한다.
[1] 그래프 접근 방식
[2] 양자화된 네트워크 표현 방식
[3] 네트워크 표현 방식
ONNX는 NNEF와 달리 Intel, NVIDIA 같은 H/W 회사도 참여하고 있어서, 다수의 ML 프레임워크를 지원한다고 한다.
ONNX는 NNEF에 비해 다수의 툴이 존재해서, 코드 및 전체적인 활용도에서 우위를 점하고 있어서 자연스럽게 많은 사용자들이 사용한다고 한다.
아무튼 표준은 ONNX 쪽으로 더 기운 것 같으므로 ONNX 채택
https://medium.com/@enerzai/onnx-%EB%84%88-%EB%88%84%EA%B5%AC%EC%95%BC-who-are-you-5c1435b997e2