[python] 파이썬 PyTorch에서 하이퍼파라미터 튜닝을 위한 라이브러리는 무엇인가?

22 Nov 2023

python

하이퍼파라미터 튜닝은 모델의 성능을 향상시키기 위해 중요한 과정입니다. PyTorch에서 하이퍼파라미터 튜닝을 수행할 수 있는 몇 가지 유용한 라이브러리가 있습니다. 이들 라이브러리를 사용하여 더 빠르고 효율적인 모델 훈련을 할 수 있습니다.

Optuna: Optuna는 베이지안 최적화를 기반으로 하는 자동화된 하이퍼파라미터 튜닝 라이브러리입니다. Optuna는 목적함수의 값을 최적화하는 데 사용되는 하이퍼파라미터 조합을 자동으로 찾아줍니다. 간단한 인터페이스와 다양한 최적화 알고리즘을 제공하여 모델의 성능 향상을 도울 수 있습니다.

import optuna
   
def objective(trial):
    # 하이퍼파라미터 조합 생성
    learning_rate = trial.suggest_float("learning_rate", 1e-5, 1e-1, log=True)
    n_units = trial.suggest_categorical("n_units", [32, 64, 128])
       
    # 모델 구성 및 학습
    model = MyModel(n_units)
    optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
    for epoch in range(10):
        # ...
       
    # 목적 함수 값 반환
    return accuracy_score(y_true, y_pred)
   
study = optuna.create_study(direction="maximize")
study.optimize(objective, n_trials=100)
   
best_params = study.best_params
best_score = study.best_value

참고: Optuna 공식 문서

Ray Tune: Ray Tune은 분산하고 확장 가능한 하이퍼파라미터 튜닝 라이브러리로, Ray 프로젝트의 일부입니다. Ray Tune은 여러 종류의 탐색 알고리즘 (예: HyperOpt, BOHB 등)을 사용할 수 있으며, 병렬 실행과 실험 추적을 지원합니다. 플러그인 아키텍처를 제공하여 사용자 정의 실험 설정이 가능하며, 여러 머신에서 스케일 아웃하여 튜닝 작업을 빠르게 수행할 수 있습니다.

import ray
import ray.tune as tune
   
def objective(config):
    # 하이퍼파라미터 조합 사용
    learning_rate = config["learning_rate"]
    n_units = config["n_units"]
       
    # 모델 구성 및 학습
    model = MyModel(n_units)
    optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
    for epoch in range(10):
        # ...
       
    # 목적 함수 값 반환
    return accuracy_score(y_true, y_pred)
   
config = {
    "learning_rate": tune.loguniform(1e-5, 1e-1),
    "n_units": tune.choice([32, 64, 128]),
}
   
analysis = tune.run(
    objective,
    config=config,
    num_samples=100,
    metric="accuracy",
    mode="max",
)
   
best_params = analysis.best_config
best_score = analysis.best_result["accuracy"]

참고: Ray Tune 공식 문서

scikit-optimize: scikit-optimize는 베이지안 최적화 및 간단한 그리드 서치와 같은 다양한 최적화 알고리즘을 제공하는 라이브러리입니다. scikit-optimize는 성능 향상을 위해 기존 모델 훈련 루프에 적용되는 콜백 함수를 제공합니다.

from skopt import BayesSearchCV
   
def model_fit(params):
    # 하이퍼파라미터 조합 사용
    learning_rate = params["learning_rate"]
    n_units = params["n_units"]
       
    # 모델 구성 및 학습
    model = MyModel(n_units)
    optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
    for epoch in range(10):
        # ...
       
    # 목적 함수 값 반환
    return -accuracy_score(y_true, y_pred)
   
opt = BayesSearchCV(
    estimator=None,  # 모델은 지정하지 않음
    search_spaces={"learning_rate": (1e-5, 1e-1, "log-uniform"), "n_units": [32, 64, 128]},
    n_iter=100,
    cv=5,
    n_jobs=-1,
)
   
opt.fit(X_train, y_train)
   
best_params = opt.best_params_
best_score = -opt.best_score_

참고: scikit-optimize 공식 문서

이러한 라이브러리들을 사용하여 PyTorch 모델의 성능을 향상시키고, 하이퍼파라미터 튜닝 과정을 자동화할 수 있습니다. 자신의 모델과 데이터에 가장 적합한 라이브러리를 선택하여 하이퍼파라미터 튜닝을 진행해 보세요!