# CV

Fine Grained Visual Classification - (1)
본 논문은 Fine-Grained Visual Claissification에서 높은 inter-clsdd similarity를 갖는 다양한 category를 구분짓는 결정적인 detailed feature을 학습 하기 위한 새로운 loss function을 제시한다.각

YOLOv3 - 뭐? abox가 10000개라고? - 논문 리뷰
이번 포스팅에서는 yolo의 세 번째 버전인 yolov3에 대해서 소개하겠습니다.anchor box 사용각 bbox의 objectness score를 logistic regression을 이용하여 예측Darknet54 ( mAP 향상, FPS 하락 )classifica

yolov2 - v1에서 v2로 진화 !! 모델 - 논문 리뷰
YOLO v1 모델 YOLOv1 모델은 GoogLeNet을 기반 커스텀 모델YOLOv1 모델은 VGG16보다 빠르지만 성능이 좋지 않음v2 → VGG 모델을 튜닝해서 사용했습니다. VGG모델은 그 당시 최고의 모델 중 하나로써 지금까지 사용이 많이 되고 있으며 많은 모
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers
KeyPoints: - Positional encodeing free hierarchically structured Transformer encoder (resolution independent test/training performance, multiscale fea
(작성중) [논문 리딩] An Image Worth 16 x 16 Words : Transformers for Image Recognition At Scale
⌜An Image Worth 16 x 16 Words : Transformers for Image Recognition At Scale⌟는 ViT(Vision Transformers)에 관한 논문이다.

YOLO v1 - 이미지에서 객체 탐지를 해볼까? - 논문 구현 part1. model
https://velog.io/@minyoungxi/YOLO-v1-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0이전 포스팅(YOLO v1 - 이미지에서 객체 탐지를 해볼까? - 논문 리뷰)에 이어서 논문을 구현하는 포스팅을 준비했습니다.

[OpenCV] Mask에 딱 맞는 BBox 그리기
python OpenCV를 사용하여 Segmentation 결과에 딱 맞는 bbox 그리기!

YOLO v1 - 이미지에서 객체 탐지를 해볼까? - 논문 리뷰
객체 인식을 regression problem으로 접근단일 네트워크 사용으로 FULL image 에서 bbox, class probabilities 예측빠른 예측 속도 ( 단일 네트워크 때문 )배경에서 오탐지할 가능성이 적음 ( bbox 학습시 각 cell 마다 박스

[논문리뷰] Diffusion-Based Scene Graph to Image Generation with Masked Constrastive Pre-Training
Scene graph와 같이 graph-structured를 input으로 받은 이미지 생성은 이미지의 옵젝트와 옵젝트들의 관계로 그래프에 노드와 연결을 배치한다는 독특한 챌린지가 있다. 가장 많이 사용하는 방법은 scene layouts을 이용하는 것인데, scen
[머신러닝] 교차검증 (cross validation) - KFold, StratifiedKFold
✔ 과적합이란? ML 모델이 학습된 데이터에선 정확한 예측을 하지만, 새로운 데이터에 대해서는 그렇지 못할 때 발생하는 현상을 뜻한다. ✔ 교차 검증이란? 데이터를 train/test로 한 번만 나누는 것이 아닌, 여러 번 다른 방식으로 나누고, 나눈 train/test 데이터를 교차하여 선택하여 이를 토대로 모델의 성능을 평가하는 방법이다. ✔ 교차 ...

The Normal Distributions Transform
Peter Biber (biber@gris.uni-tuebingen.de)2D range scan matching은 여러 localization, mapping 알고리즘의 기본 요소이다.대부분의 scan matching 알고리즘은 사용되는 feature(point, l

StyleGAN
StyleGAN은 PGGAN구조에서 Style transfer 개념을 적용하여 generator architecture를 재구성한 논문이다. 이론 인해 PGGAN에서 불가능했던 style 을 scale-specific control이 가능하게 되었다.특징 512차원의
KD-Tree와 Nearest Neighbor search
k-d tree(k-dimensional tree)는 컴퓨터 비전 분야에서 "space-partitioning data structure for organizing points in a k-dimensional space"을 의미한다.

AdaIN
최초의 Neural Style Transfaer 를 제안한 Gatys의 Style Transfer 방식은 다양한 Style을 Arbitrary 하게 (그때 그때 새로운 스타일을) 적용할 수 있는 반면에, 굉장히 느린 속도로 style transfer 를 수행한다는 단점

Ceres-Solver 튜토리얼
Ceres-Solver를 이용하면 아래와 같은 bounds constrained robustified non-linear least squares problem을 풀 수 있다.ResidualBlock : $\\rhoi(||f_i(x{i1},...,x{ik})||^2)$