lstm 11. conv2d 하는 방법

RNN

목록 보기

10/14

conv2d에서 사용되는 파라미터는 in_channels, out_channels, kernel_size다.

나머지 파라미터는 기본값이 입력되어 있다.

    stride=1, 
    padding=0, 
    dilation=1, 
    groups=1, 
    bias=True, 
    padding_mode='zeros'

내가 만약 28x28 size를 가진 mnist자료를 사용한다고 하면,

in_channels: 1
out_channels: 3
kernel_size:3

이 값을 입력하면 위 layer의 weight가 가지는 shpe가 (3,1,3,3)이 된다. 이 것은 차례대로 batch_size, channels, height, width가 된다.

in_channels: input image의 channel 수이다. rgb 이미지라면 3이 된다.
out_channels: convolution에 의해서 생성된 channel 수이다.
kernel_size: filter의 크기이다.

view와 reshape 둘다 tensor의 모양을 바꾸는 데 사용된다. 그러나 둘 사이에 차이가 있다. view는 값을 변형시켜 제공하지만 reshape은 tensor의 복사본 혹은 view를 제공한다.

둘 다 유사한 방식으로 작동한다. transpose는 딱 두 개의 차원을 맞교환할 수 있다. 그러나 permute는 모든 차원들을 맞교환할 수 있다.

끊임없이 뭔가를 남기는 사람