profile
sshinohs

Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

computationally intensivememory intensivepruningtrained quantizationHuffman codingpruning -> quantization -> Huffman coding전체: storage requirements를 3

2023년 3월 2일
·
0개의 댓글
·

tensorrt profiling, nvtx, nsight

https://developer.nvidia.com/ko-kr/blog/nvidia-tools-extension-api-python-및-c-c에서-코드를-프로파일링하기-위한-주석/

2023년 2월 26일
·
0개의 댓글
·

WSL에서 TensorRT 환경 구축

사양windows 11wslubuntu2204.exertx 3060cuda 11.6cudnn 8.7체크 할 것tensorrt download linktensorrt path 설정pycuda

2023년 2월 26일
·
0개의 댓글
·

pytorch onnx tensorrt 예제

https://github.com/NVIDIA/TensorRT/blob/main/quickstart/IntroNotebooks/4.%20Using%20PyTorch%20through%20ONNX.ipynb

2023년 2월 26일
·
0개의 댓글
·

M1 Macbook으로 WSL에 원격 접속하기

ubuntu2204.exefontwarning: setlocale: LC_CTYPE: cannot change locale (UTF-8)

2023년 2월 23일
·
0개의 댓글
·
post-thumbnail

M1 Macbook 환경에서 PyTorch Profiler 테스트

PyTorch는 M1 Macbook의 GPU를 "mps"라는 이름으로 구동 가능예제를 돌렸을 때, MPS가 약 10배 빠름PyTorch Profiler는 MPS 지원은 아직 안되는 것 같다.M1 CPU로 돌렸을 때M1 MPS로 돌렸을 때

2023년 2월 22일
·
0개의 댓글
·

macbook m1 에서 pytorch 사용 시 _lzma 에러 뜰 때.

https://codethief.io/ko/m1-맥북의-pyenv-환경에서-torchvision-import시-에러module-not-found-error-no-module-named-\_lzma/

2023년 2월 22일
·
0개의 댓글
·

PyTorch Profiler & DLProf

2023년 2월 22일
·
0개의 댓글
·
post-thumbnail

DL profiling 도구들

도구 두 가지 PyTorch Profiler TensorBoard Detail PyTorch Profiler Typical steps to optimize your model PyTorch Profiler의 profiling 결과는 TensorBoard에서 확인할

2023년 2월 21일
·
0개의 댓글
·
post-thumbnail

모델 경량화 도구(tool)들

ONNXTensorRTPyTorch MobileTensorFlow LiteNCNNONNX다양한 machine learning framework의 산출물들을 ONNX 형식으로 변환함ONNX Design Principlestraditional ML, DNN 지원빨리 개선할

2023년 2월 20일
·
0개의 댓글
·
post-thumbnail

모델 경량화 기법 분류

QuantizationPruningKnowledge DistillationLow-Rank ApproximationWeight SharingOthersQuantization: This involves reducing the number of bits used to rep

2023년 2월 15일
·
0개의 댓글
·
post-thumbnail

Model Compression and Hardware Acceleration for Neural Networks: A Comprehensive Survey

Abstract무어의 법칙 끝남DNN은 메모리 및 많은 연산 필요 -> compression, hardware acceleration 필요trade off: processing efficiency vs application accuracycomprehensive한 su

2023년 2월 10일
·
0개의 댓글
·

torch.reshape vs torch.view.contiguous

속도 차이 없음

2023년 2월 2일
·
0개의 댓글
·

서비스에 적절한 Image Animation Format을 찾아보자

적절한 image format 찾기변환 소요시간이 짧으면 좋다.용량을 적게 차지하면 좋다.프레임 별 구분이 가능해야 한다.jpegswebpsgif (Animation)webp (Animation)

2023년 1월 25일
·
0개의 댓글
·

PIL image 형식 FastAPI 전송

https://wooiljeong.github.io/python/fastapi-image/

2023년 1월 14일
·
0개의 댓글
·

git checkout 시 permission denied 되면서 파일 생성 안될 때

폴더 권한 변경

2023년 1월 14일
·
0개의 댓글
·

PostgreSQL Database Python으로 제어하기 (CRUD)

https://edudeveloper.tistory.com/131

2023년 1월 14일
·
0개의 댓글
·