[파이썬] PyTorch RNN과 LSTM 구현

07 Sep 2023

PyTorch

이번 포스트에서는 PyTorch를 사용하여 RNN (Recurrent Neural Network)과 LSTM (Long Short-Term Memory) 모델을 구현하는 방법을 알아보겠습니다. RNN은 순차적인 데이터를 처리하는데 유용하며, LSTM은 RNN의 변형으로서 장기적인 의존성을 학습할 수 있습니다.

RNN 모델 구현하기

먼저 PyTorch에서 RNN 모델을 구현하는 방법을 알아보겠습니다. 다음은 간단한 예제 코드입니다.

import torch
import torch.nn as nn

# 하이퍼파라미터 설정
input_size = 10
hidden_size = 20
sequence_length = 5
num_layers = 2

# RNN 모델 정의
rnn = nn.RNN(input_size, hidden_size, num_layers)

# 입력 데이터 생성
input_data = torch.randn(sequence_length, 1, input_size)

# 초기 hidden state 생성
hidden = torch.zeros(num_layers, 1, hidden_size)

# RNN 모델에 입력 데이터 전달
output, hidden = rnn(input_data, hidden)

# 출력 확인
print(output)

위에서는 nn.RNN 클래스를 사용하여 RNN 모델을 정의합니다. 모델을 생성한 후, 입력 데이터와 초기 hidden state를 생성하고, rnn 모델에 입력 데이터와 hidden state를 전달하여 결과를 얻습니다.

LSTM 모델 구현하기

이번에는 LSTM 모델을 구현하는 방법을 알아보겠습니다. 다음은 LSTM 모델을 사용하여 순차적인 데이터를 처리하는 예제 코드입니다.

import torch
import torch.nn as nn

# 하이퍼파라미터 설정
input_size = 10
hidden_size = 20
sequence_length = 5
num_layers = 2

# LSTM 모델 정의
lstm = nn.LSTM(input_size, hidden_size, num_layers)

# 입력 데이터 생성
input_data = torch.randn(sequence_length, 1, input_size)

# 초기 hidden state 및 cell state 생성
hidden = torch.zeros(num_layers, 1, hidden_size)
cell = torch.zeros(num_layers, 1, hidden_size)

# LSTM 모델에 입력 데이터 전달
output, (hidden, cell) = lstm(input_data, (hidden, cell))

# 출력 확인
print(output)

위 코드에서는 nn.LSTM 클래스를 사용하여 LSTM 모델을 정의합니다. 모델을 생성한 후, 입력 데이터와 초기 hidden state, cell state를 생성하고, lstm 모델에 입력 데이터와 hidden state, cell state를 전달하여 결과를 얻습니다.

결론

이번 포스트에서는 PyTorch를 사용하여 RNN과 LSTM 모델을 구현하는 방법을 알아보았습니다. 순차적인 데이터 처리에 유용한 RNN과 장기적인 의존성을 학습하는 LSTM은 다양한 자연어 처리 및 시계열 데이터 분석에 활용할 수 있습니다. 바로 실제 데이터에 적용해보며 더 깊이있는 이해를 할 수 있도록 노력해보세요.