[파이썬] PyTorch 실제 생활에서의 `PyTorch` 활용

07 Sep 2023

PyTorch

소개

PyTorch는 딥 러닝을 위한 프레임워크로서, 다양한 분야에서 실제로 활용될 수 있습니다. 이 글에서는 PyTorch를 사용하여 실생활에서의 다양한 예시들을 살펴보고, 어떻게 PyTorch를 활용하여 문제를 해결할 수 있는지 알아보겠습니다.

이미지 분류

PyTorch는 이미지 분류 작업에 매우 효과적으로 사용될 수 있습니다. 예를 들어, 스팸 필터링을 위해 이메일 메시지를 자동으로 분류하는 시스템을 만든다고 가정해 봅시다. PyTorch를 사용하면 이미지 분류 모델을 쉽게 구축하고 학습시킬 수 있습니다.

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms

# 데이터셋 불러오기
transform = transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])
train_dataset = datasets.ImageFolder('data/train', transform=transform)
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)

# 신경망 모델 정의하기
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1)
        self.relu = nn.ReLU()
        self.maxpool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.fc = nn.Linear(32 * 16 * 16, 10)
    
    def forward(self, x):
        x = self.conv1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

model = Net()

# 모델 학습하기
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
for epoch in range(10):
    for images, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

# 테스트 데이터셋 불러오기
test_dataset = datasets.ImageFolder('data/test', transform=transform)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=64, shuffle=True)

# 모델 평가하기
correct = 0
total = 0
with torch.no_grad():
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

accuracy = 100 * correct / total
print(f'Accuracy of the network on the test images: {accuracy}%')

위 코드는 간단한 CNN(Convolutional Neural Network) 모델을 사용하여 이미지 분류를 수행하는 예시입니다. 학습 데이터셋과 테스트 데이터셋을 불러와서 모델을 학습시킨 후, 테스트 데이터셋에서 모델의 성능을 평가합니다. 이를 통해 이미지 분류 문제를 PyTorch를 활용하여 해결할 수 있습니다.

자연어 처리

PyTorch는 자연어 처리 작업에서도 효과적으로 사용될 수 있습니다. 예를 들어, 스팸 메시지를 식별하는 텍스트 분류 모델을 만든다고 가정해 봅시다. PyTorch를 사용하면 간단하게 텍스트 분류 모델을 구축하고 학습시킬 수 있습니다.

import torch
import torch.nn as nn
import torch.optim as optim
from torchtext import data
from torchtext.datasets import IMDB
from torchtext.vocab import GloVe

# 필드 정의하기
TEXT = data.Field(lower=True, include_lengths=True, batch_first=True)
LABEL = data.LabelField(dtype=torch.float)

# 데이터셋 불러오기
train_data, test_data = IMDB.splits(TEXT, LABEL)

# 단어 임베딩 적용하기
TEXT.build_vocab(train_data, vectors=GloVe(name='6B', dim=300))
LABEL.build_vocab(train_data)

# 데이터셋 배치 작업하기
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
train_loader, test_loader = data.BucketIterator.splits((train_data, test_data), batch_size=64, device=device)

# 신경망 모델 정의하기
class Net(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim):
        super(Net, self).__init__()
        self.embedding = nn.Embedding(vocab_size, embedding_dim)
        self.rnn = nn.LSTM(embedding_dim, hidden_dim, batch_first=True)
        self.fc = nn.Linear(hidden_dim, output_dim)
    
    def forward(self, text, text_lengths):
        embedded = self.embedding(text)
        packed = torch.nn.utils.rnn.pack_padded_sequence(embedded, text_lengths.cpu(), batch_first=True, enforce_sorted=False)
        output, (_, _) = self.rnn(packed)
        output, _ = torch.nn.utils.rnn.pad_packed_sequence(output, batch_first=True)
        output = self.fc(output[:, -1, :])
        return output

model = Net(len(TEXT.vocab), 300, 256, 2)

# 모델 학습하기
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
for epoch in range(10):
    for batch in train_loader:
        optimizer.zero_grad()
        text, text_lengths = batch.text
        labels = batch.label
        outputs = model(text, text_lengths)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

# 모델 평가하기
correct = 0
total = 0
with torch.no_grad():
    for batch in test_loader:
        text, text_lengths = batch.text
        labels = batch.label
        outputs = model(text, text_lengths)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

accuracy = 100 * correct / total
print(f'Accuracy of the network on the test reviews: {accuracy}%')

위 코드는 LSTM(Long Short-Term Memory) RNN(Recurrent Neural Network)을 사용하여 텍스트 분류를 수행하는 예시입니다. IMDB 데이터셋을 불러와서 모델을 학습시킨 후, 테스트 데이터셋에서 모델의 성능을 평가합니다. 이를 통해 자연어 처리 문제를 PyTorch를 활용하여 해결할 수 있습니다.

결론

PyTorch는 다양한 실제 생활 문제에 적용될 수 있는 강력한 도구입니다. 이미지 분류와 자연어 처리를 포함한 다양한 예제를 통해 PyTorch의 활용법을 살펴보았습니다. 이제 다른 문제들에도 PyTorch를 적용하여 효과적인 솔루션을 개발해 보세요. Happy coding!