이미지를 보고 어떤 카테고리에 넣어야할지 정하는 것 기계에게는 어려운 일임 -> 컴퓨터는 어떻게 생각하는지 생각하자 숫자 집합으로 봄, 고양으로 인식하는 것을 어려워 보임 Sematic gap 이미지에 작은 변화만 줘도 픽셀값은 변화함 ex. 카메라가 아주 조금 움
3배 더 큰 UNet 백본파라미터 증가 - attention block, 더 넓은 범위의 cross-attention context, 두번째 text 인코더 사용cross-attentionSelf-attention: 한 시퀀스 내의 토큰들 사이의
6강에 이어서 7강에서는 뉴런 네트워크를 효과적으로 구축하기 위한 방식에 대해 이야기한다. Fancier optimization Regularization Transfer learning 에 대해 알아볼 예정이다. Optimization 가장 중요한 것은 최적화 문제