1.
2. 입력이 7x7이고, 3x3 convolution layer (padding 1, stride 1)일 때 출력의 크기는 얼마인가?
$[(N + 2P -F)/S] + 1$
= [ (7 + 2*1 - 3) / 1 ] + 1 = 6 + 1 = 7
⇒ 7x7
∴ 7x7 output
3. Average pooling with 2x2 filters (stride 2)를 수행 했을 때 결과를 써라.
$$
\begin{bmatrix}3.25 & 5.25 \\2 & 2 \\\end{bmatrix}
$$
4. 3x3 convolution layer (stride 1)이 2개 있을 때, effective receptive field의 크기는 어떻게 되는가?
- 첫 번째 레이어
- 초기 receptive field : 1(자기 자신)
- 첫 번째 필터(3x3, stride 1) 적용 후 : 3x3
- 두 번째 레이어
- 입력 크기 : 3x3 (= 첫 번째 레이어의 출력)
- 두 번째 필터(3x3, stride 1) → 적용 후 : (3+2)x(3+2) = 5x5
∴ effective receptive field의 크기는 5x5
5. 학습에 대한 accuracy 그래프가 다음과 같이 주어졌다. 어떻게 하면 더 잘 동작하게 만들 수 있을까?
∴ Train Accuracy와 Val Accuracy가 계속 증가하고 있으므로, 학습을 계속해서 진행하면 된다.
6. RNN에서 사용되는 각 주요 구성 요소(input, hidden state, output)에 대해 설명하시오.
- input : 시간 순서에 따라 RNN에 제공되는 데이터.