Hyperparameter

July 2, 2024 1 분 소요

Hyperparameter 연구중…!!!

	Hyperparameter	Parameter
설명	초매개변수 모델 학습 과정에 반영되는 값 학습 시작 전에 미리 조정 매개변수	매개변수 모델 내부에서 결정되는 변수 데이터로부터 학습 또는 예측되는 값
예시	학습률 손실 함수 배치 사이즈	정규분포의 평균, 표준편차 선형 회귀 계수 가중치, 편향
직접 조정 가능	O	X

이외에도 SVM의 C와 감마, 랜덤포레스트의 가지 개수 등 모델에서 우리가 직접 설정해야 하는 변수들을 통칭해 ‘Hyperparameter’라고 한다.

이 중 manual을 제외한 나머지 방법을 ‘automated hyperparameter selection’이라 부른다.

https://optuna.org/

Optuna란 Hyperparameter 최적화 태스크를 자동화해주는 프레임워크로, 다음과 같은 장점이 있다.

이러한 이유로 Hyperparameter 튜닝 자동화 프레임워크인 HyperOpt와 비교했을 때 비교적 많이 쓰이고 있다.

Optuna를 이해하기 위해서는 다음의 용어에 익숙해져야 한다.

쉽게 말해 study는 최적화를 하는 과정이고, trial은 다양한 조합으로 목적함수를 시행하는 횟수를 뜻한다.

Study의 목적은 여러 번의 trial을 거쳐 최적의 Hyperparameter 조합을 찾는 것이라고 할 수 있겠다.

https://hyperopt.github.io/hyperopt/

HyperOpt는 베이지안 최적화의 접근 방식을 취한다.

베이시안 최적화는 objective function(목적 함수)를 최대/최소로 하는 최적해를 찾는 기법이다.

목적함수와 Hyperparameter의 Pair를 대상으로 Surrogate Model을 만들어 평가하면서 순차적으로 업데이트 하면서 최적의 조합을 찾아낸다.

HyperOpt는 자동화된 Hyperparameter 튜닝 프레임워크로서, fmin()이라는 함수 안에는 3가지의 파라미터가 있다:

https://neptune.ai/blog/optuna-vs-hyperopt

https://ichi.pro/ko/hyperopt-beijian-choejeoghwaleul-giban-eulo-han-haipeo-palamiteo-tyuning-140338828128041

https://velog.io/@emseoyk/%ED%95%98%EC%9D%B4%ED%8D%BC%ED%8C%8C%EB%9D%BC%EB%AF%B8%ED%84%B0-%ED%8A%9C%EB%8B%9D

https://shinminyong.tistory.com/37

참고