소프트맥스2 소프트맥스 함수를 사용하는 이유? 소프트맥스 함수의 이름의 의미는 무엇일까요? 이 단어는 Soft와 Max의 결합어인데요. 입력 값의 ‘가장 큰값’을 ‘부드럽게’ 선택하는 과정이라고 합니다. 아직 무슨 소리인지 모르겠죠? 소프트맥스는 딥러닝, 특히 다중 클래스 분류 문제에 자주 등장합니다. 신경망의 출력 층에서 있는 것을 보셨을거예요. 이 글에서 소프트맥스 함수는 무엇이고 어떤 원리로 딥러닝에서 사용하는지 알아보도록 하겠습니다. Softmax 란소프트맥스 함수는 임의의 실수 값으로 구성된 벡터를 확률 분포로 바꾸는 데 사용됩니다. 쉽게 말해 입력 벡터(일반적으로 신경망의 마지막 레이어의 출력)를 가져와 이를 합이 1이 되는 확률 벡터로 변환한다는 말입니다. 이는 입력이 여러 중 하나에 속할 수 있는 시나리오(클래스 분류)에서 예측할때 필.. 2024. 1. 16. 신경망 모델 표기법 및 출력층 설계 이번 포스팅에서는 딥러닝에서 표기법과 하이퍼 파라미터에 대해 알아보겠습니다. 신경망은 많은 부분 그림을 통해 설명을 하기 때문에 가중치의 표기법이 필요한 이유입니다. 가중치 표기법 가중치는 층(Layer)의 상태를 나타냅니다. 각 층의 파리마터, 즉 가중치는 최종적으로 모델이 학습을 진행하면서 이 가중치가 변하게 됩니다. 그리고 가중치에 의해 특성들을 더 잘 추출하고 예측을 잘하는 모델이 됩니다. 예를 들어, 표기법 W12에 대해 설명드리면, 첫 번째 Layer의 위치한 가중치 요소를 말하며 의미하는 바는 각각 아래와 같습니다. 1은 출력 노드 : 출력 레이어(Layer 1)의 첫 번째 노드(ℎ1) 2는 입력 노드 : 입력 레이어(Layer 0)의 두 번째 노드(𝑥2) 네트워크 구조 결정 파라미터 설정 .. 2024. 1. 11. 이전 1 다음