profile
✉️ qtly_u@naver.com
태그 목록
전체보기 (46)CNN(5)Object Detection(5)Deep Learning(3)YOLO(3)Vision Transformer(3)NLP(3)pose estimation(3)VAE(3)ViTPose(3)boj(3)Stable Diffusion(3)kaggle(2)Attention(2)이분탐색(2)Keras(2)Resnet(2)RNN(2)Computer Vision(2)git(2)딥러닝(2)Bounding Box(2)ViT(2)포스코 ai big data 아카데미 20기(2)포스코 ai big data 아카데미(2)머신러닝(2)Lora(2)한이음(2)캐글(2)LSTM(2)LLM(2)transformer(2)Contrastive Learning(2)DNN(2)객체 인식(1)cold start(1)MetaFormer(1)causal inference(1)MicroNet(1)YOLO yaml(1)Soft NMS(1)Fire module(1)GPT(1)image embedding(1)ML/DL(1)inpainting(1)fewer parameters(1)백준 1920번(1)CEVAE(1)attention mechanism(1)경량화기법(1)NMS란(1)CNN inductive bias(1)bisect(1)Fast(1)한이음블렌디드러닝(1)latent variables(1)메뉴 추천(1)git 초급(1)아카데미 20기(1)Knowledge distillation(1)programmers(1)한이음프로젝트(1)Randomforest(1)git repository(1)Seq2Seq(1)YOLOv8(1)LoRA adaptation(1)Image Captioning(1)Shift-based convolution(1)parameter tuning(1)anchor box(1)이미지처리(1)SOTA(1)Graph(1)프로그래머스(1)Mixture of Experts(1)interpretability(1)sam(1)bayesian(1)모델 경량화(1)Paper(1)한이음 공모전 수상(1)키즈카페 입지선정(1)ORB(1)Active Shift(1)Pretrained model(1)교육(1)Image Augmentation(1)경량 네트워크(1)deep learning embedding(1)Latent space(1)포유드림(1)vision-language understanding task(1)POSTECH(1)Inception-v4(1)SqueezeNet(1)Non-local block(1)hybrid approaches(1)SVM(1)딕셔너리(1)피보나치(1)임베디드 디바이스(1)AE(1)지식증류기법(1)Causal Effect(1)project(1)케라스(1)PyTorch(1)CNN 경량화(1)AutoEncoder(1)컴퓨터 비전(1)knowledge decomposition(1)DP(1)경량화툴(1)git 강의(1)Sliding Window(1)군집화(1)Yolo 구조(1)Encoder / Decoder(1)Yolo 버전별 특징(1)파이토치(1)Collaborative Filtering(1)Hybrid recommender systems(1)AI big data 교육(1)캐글 분류문제(1)TensorFlow Lite(1)YOLO 학습(1)bottom up(1)German Traffic Sign Benchmark(1)GoogleNet(1)입지선정 프로젝트(1)영상 분류(1)zeroshot prediction(1)한이음 후기(1)python(1)과적합 방지(1)Prompt Tuning(1)딥러닝모델(1)counter(1)Posco AI Big Data Academy(1)콘텐츠 기반 추천(1)무려20기(1)컨텐츠 기반 추천(1)bottleneck(1)객체 검출 경량화(1)Recurrent Model(1)콜백함수(1)추천시스템 사용예제(1)경량화 기법(1)ROI(1)자기계발(1)Residual block(1)offset(1)BRIEF(1)yolov5(1)이진탐색 알고리즘(1)colab(1)인공신경망(1)디바이스 객체 검출(1)huggingface(1)한이음 프로젝트(1)분류기 비교(1)skip connection(1)한이음 ICT 멘토링(1)Token Mixer(1)KL divergence derivation(1)자연어처리(1)rcnn(1)하이퍼파라미터(1)포스코 아카데미 후기(1)코테(1)Deep Neural Network(1)git 초보(1)item-to-item(1)YOLO hyper parameter(1)포스코 아카데미 20기(1)온디바이스(1)Air(1)BERT(1)scalability(1)Exploitation-Exploration(1)Shift operation(1)한이음유데미(1)자격증(1)posco(1)WGAN-GP(1)big data(1)유튜브 추천시스템(1)git 명령어(1)텐서플로(1)머신러닝분류모델(1)callbacks(1)Classification(1)stable diffusion webUI(1)paper-review(1)wgan(1)Data Analytics(1)simon funk's SVD(1)Vanishing gradient(1)image classification(1)추천시스템(1)ANN(1)Recommender System(1)feature descriptor(1)pytorch JIT(1)tensorflow(1)mode collapse(1)ICT멘토링(1)NVIDIA APEX(1)AI(1)유데미(1)머신러닝분류기 비교(1)git 시작하기(1)딥러닝 모델 경량화(1)prefix tuning(1)TensorRT(1)Non Maximum Suppression(1)Pytorch 경량화(1)MOE(1)포스코 아카데미(1)1 stage detector(1)VLP(1)detection model(1)content-based recommendation(1)tesorflow(1)교통표지판 분류(1)독일 교통표지판(1)self-attention(1)Vision-Language(1)iou(1)Linkedin 추천시스템(1)한이음 gitlab(1)NMS(1)hyp.scratch-low.yaml(1)bounding box anchor box 차이(1)latent-factor methods(1)augmentation parameter(1)포스코 포유드림(1)추천방정식(1)Negative sampling(1)Yolo Architecture(1)2 stage detector(1)Bisect 라이브러리(1)segment anything(1)slow&fast(1)Natural Language Processing with Disaster Tweets(1)YOLO parameter(1)Git 공부(1)segmentation(1)quantization(1)추천 알고리즘(1)youtube 추천시스템(1)inception(1)크롤링(1)variational autoencoder(1)clip(1)GTSRB(1)github(1)Yolo version(1)딥러닝모델 경량화(1)Wasserstein loss(1)image-to-text generation(1)캐글 교통표지판분류(1)VISION(1)Binary Search(1)백준(1)이진탐색(1)MobileNetv3(1)계산 그래프(1)temporal CNN(1)on-device AI SOTA(1)selective-search(1)Embedding(1)딥러닝 프레임워크(1)Recommender Systems(1)stable diffusion install(1)Low-Rank Adaptation(1)2022 한이음 공모전(1)opencv(1)150370번(1)shufflenet(1)Threshold(1)분류모델비교(1)Overlap problem(1)confidence score(1)Yolo 버전별 성능(1)포항공대(1)공부(1)region-proposal(1)동적계획법(1)detector(1)Sequence Model(1)Inductive Bias(1)2023 강서구 빅데이터 활용 공모전(1)dynamic programming(1)video-classification(1)DP예제(1)Hyper-parameter(1)Long Term Dependency(1)Adapter(1)Action classification(1)Yolo series(1)Video Recognition(1)협업 필터링(1)Yolo SOTA(1)모델 파라미터(1)gan(1)시각화(1)카카오블라인드(1)
post-thumbnail

ViTPose++: Vision Transformer for Generic Body Pose Estimation

Vision Transformer는 컴퓨터 비전 작업에서 큰 잠재력을 보여주었으며, human body pose estimation에 적용되어 우수한 성능을 얻었습니다. 기존의 ViTPose에서는 vision transformer를 pose estimation tas

2024년 6월 9일
·
0개의 댓글
·
post-thumbnail

[paper] Inpaint Anything

Inpaint Anything 논문은 23년 4월에 발표되었습니다. 이 논문은 Segment Anything Model(SAM)을 기반으로 한 이미지 인페인팅 시스템을 소개합니다. 이 프레임워크는 다음과 같은 주요 기능을 제공합니다.Remove Anything: 사용자

2024년 6월 7일
·
0개의 댓글
·
post-thumbnail

GAN Mode collapse, Wasserstein Loss, Weight Clipping, Gradient Penalty

generator가 discriminator가 못 맞추는 클래스를 파악해서 그 클래스만 계속 생성해서 discriminator가 전부 오분류하도록 하는것 즉 generator가 local minima에 갇힌 것이다. Problem with BCE lossGAN에서 bi

2024년 4월 26일
·
0개의 댓글
·
post-thumbnail

[paper] MetaFormer Is Actually What You Need for Vision

본 글에서는 CVPR에서 22년도에 발표된 MetaFormer is Actually What You Need for Vision, Yu et al.에 대해 간단하게 정리하겠습니다.논문에서는 일반화된 트랜스포머 아키텍처를 제안합니다.여기서 기존 트랜스포머 구조에서 Sel

2024년 3월 26일
·
0개의 댓글
·
post-thumbnail

[paper] Inception v4 (2016)

Inception 아키텍처는 초기에 GoogLeNet으로 알려져 있었으며, 이후 Inception v2, Inception v3 등 다양한 버전이 발표되었습니다. Inception v4는 2016년에 소개되었으며, 그 이후로도 다양한 개선이 이루어진 것으로 알려져 있습

2024년 3월 13일
·
0개의 댓글
·
post-thumbnail

PEFT(Parameter-Efficient Fine-Tuning) 라이브러리 : 대규모 Pre-trained Language Model 효과적으로 활용하기

Pre-trained Language Model (PLM) 효율적으로 finetuning하기, PEFT 방법론 ``LoRA``, ``prompt tuning``, ``prefix tuning``

2024년 3월 8일
·
0개의 댓글
·
post-thumbnail

Linux server에서 Stable diffusion web-ui 설치하기

깃헙 설치 매뉴얼처럼 sudo 접근이 불가한 server에서 stable diffusion 설치하기

2024년 3월 1일
·
0개의 댓글
·
post-thumbnail

[paper] BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

오늘 소개하는 BLIP(paper)는, 2022년 발표된 논문으로 vision-language understanding tasks와 generation-based tasks 모두 유연하게 사용할 수 있도록 아키텍처를 설계하였고, 합성된 캡션을 생성하고 기존

2024년 1월 30일
·
1개의 댓글
·
post-thumbnail

Stable diffusion webui 설치 및 실행방법, 에러

github link : https://github.com/AUTOMATIC1111/stable-diffusion-webui/위 레포지토리를 clone하고 webui-user.bat 파일을 더블클릭하여 실행하면 된다.이때 python을 찾을 수 없다는 에러가

2024년 1월 22일
·
6개의 댓글
·
post-thumbnail

CLIP (Contrastive Language Image Pretraining)

CLIP은 OpenAI가 2021년 발표했으며, 이미지 인식 시 레이블이 알려지지 않은 데이터를 효과적으로 사전학습시키는데 사용된다. CLIP 방법론의 핵심은 Image Encoder와 Text Encoder를 Contrastive Learning 방법으로 학습한다는

2024년 1월 4일
·
0개의 댓글
·
post-thumbnail

[project] 메뉴 추천 시스템

내맘대로 만든 메뉴추천시스템 진행과정을 간략하게 정리해봤다. 프로젝트는 데이터 수집 단계부터 추천방정식 구현, 평가지표 고민까지 다양한 과정을 거쳤다.

2023년 12월 12일
·
0개의 댓글
·
post-thumbnail

[공모전] 서울형 키즈카페 입지선정

공모전명 2023 강서구 빅데이터 활용 공모전공모기간 ~ 23. 3. 24. 18:00진행기간 23. 3. 10. ~ 23. 3. 24. (약 2주)진행인원 4명🗓️ 노션 페이지📄 분석보고서.pdf 💬 github팀원들과 함께 주제와 분석 프로세스를

2023년 12월 12일
·
0개의 댓글
·
post-thumbnail

LoRA: Low-Rank Adaptation of Large Language Models

transformer 기반의 모델을 이용하려고 할 때 downstream task를 적용하기 위한 작은 데이터를 위해 full fine tuning 하는 것이 비효율적이다.따라서 transformer의 좋은 generalization 성능을 유지하면서 기존의 pretr

2023년 11월 23일
·
0개의 댓글
·
post-thumbnail

대용량 파일 commit 취소 & git LFS (Large File Storage)

commit 후 push했는데 파일 크기가 100MB가 넘어가서다음과 같은 에러떴을 때remote: error: File file4.ipynb is 150.45 MB; this exceeds GitHub's file size limit of 100.00 MBremote

2023년 11월 14일
·
0개의 댓글
·
post-thumbnail

Attend, Infer, Repeat: Fast Scene Understanding with Generative Models

이번 논문은 2016년 발표된 논문으로 VAE에 RNN구조를 추가하여 구조화된 이미지 해석이 가능한 프레임워크를 제안하였습니다. 객체에 대해 명시적으로 추론하는 구조화된 이미지 모델에서 효율적인 추론을 위한 프레임워크 제시한다.한 scene의 요소들에 주목하고 장면을

2023년 9월 27일
·
0개의 댓글
·
post-thumbnail

ViT의 Inductive Bias가 도대체 어떻다는 거야

ViTPose 정리하다가 ViTPose 살펴보고, 이미지 태스크에서 CNN 기반 모델과 ViT가 어떤 구조적 차이점이 있을까 살펴보다가 거슬러 여기까지 온 이야기 거슬러 온 순서 ··· 1) ViTPose: Simple Vision Transformer Baselin

2023년 9월 25일
·
0개의 댓글
·
post-thumbnail

CEVAE / Causal Effect Inference with Deep Latent-Variable Models

"Causal Effect Inference with Deep Latent-Variable Models"은 2017년 NIPS (Neural Information Processing Systems) 컨퍼런스에서 발표된 논문입니다. 이 논문은 딥러닝과 잠재 변수 모델을

2023년 9월 21일
·
0개의 댓글
·
post-thumbnail

오토인코더의 모든 것 강의 정리

이활석 님의 '오토인코더의 모든 것' 유튜브 강의를 듣고 정리한 노트입니다.

2023년 9월 21일
·
0개의 댓글
·
post-thumbnail

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

이 논문에서는 ViTPose라는 간단한 베이스라인 모델을 통해서 다양한 측면(모델 구조의 단순함, 모델 크기의 확장성, 훈련 패러다임의 유연성, 모델 간 지식 전달 가능성)에서 자세 추정을

2023년 9월 11일
·
0개의 댓글
·