데이널 『데이터 ∙ 분석 ∙ 지식소통』::딥러닝 하이퍼파라미터 튜닝 및 설정

이번 포스팅에서는 딥러닝에서 하이퍼파라미터 튜닝과 설정에 대해 알아보도록 하겠습니다. 딥러닝 모델링은 Layer 설계 단계, 컴파일 단계, 모델 fit 단계로 나눌 수 있습니다. 각 단계별로 하이퍼파라미터와 어떤 설정들을 고려해야 하는지 살펴보겠습니다.

입력 층 : tensor 정의, 미니 배치 크기(Mini-batch Size) 정의
출력 층 : 출력이 몇개인지, 활성화 함수(ReLU 등) 설정
은닉 층 : 은닉층의 뉴런 개수, 활성화 함수 설정
네트워크 : Layer 몇층할지, 노드 몇 개 할지, 연결방식 결정

훈련할 데이터 정의 : 훈련할 데이터에 대해 미리 분리해서 정의해 놓아야 합니다. 훈련 데이터는 많을수록 좋기 때문에 추가적으로 훈련 데이터 확장하는 방법에 대해서도 고려가 필요합니다.
훈련할 epoch 횟수 정의 : epoch 횟수가 어는 정도되어야 모델이 fit 한 지를 테스트해야 합니다.
최적의 Batch size 정의 : 최적의 batch size 를 random Search나 grid Search로 찾아야 합니다.
정규화 파라미터(Regularization parameter) : L1, L2 등 정규화 방법을 사용하여 모델을 정규화할 수 있습니다.
훈련 조기 종료(Early Stopping) : 학습에 대해 조기 종료를 결정하는 변수입니다. 자동으로 훈련을 종료하게 할 수 있습니다.

오차역전파 알고리즘: 핵심은 연쇄법칙(chain rule) (0)	2024.01.25
딥러닝 모델 일반화(regularization) 총정리 (1)	2024.01.24
딥러닝의 수치미분과 편미분: 꼭 알아야 할 미분 공식 (1)	2024.01.22
딥러닝 학습 방법: batch size, Iteration, epoch(에포크) (0)	2024.01.19
딥러닝에서 크로스 엔트로피(Cross Entropy)를 사용하는 이유 (0)	2024.01.18