[파이썬] fastai 콘볼루션 신경망 (CNN) 깊이 조정

07 Sep 2023

fastai

콘볼루션 신경망(Convolutional Neural Network, CNN)은 이미지 인식 및 컴퓨터 비전 작업에서 매우 효과적인 딥러닝 모델입니다. FastAI 라이브러리는 CNN 모델을 구축하고 학습하는 데 매우 편리한 기능을 제공합니다. 이번 블로그 포스트에서는 FastAI를 사용하여 CNN 모델의 깊이를 조정하는 방법에 대해 알아보겠습니다.

1. CNN 모델 구축하기

FastAI는 PyTorch를 기반으로 하며, CNN 모델을 구축하기 위해 PyTorch의 nn.Module을 사용합니다. 먼저 FastAI를 설치하고 필요한 라이브러리를 임포트하겠습니다:

!pip install fastai
from fastai.vision.all import *

이제 CNN 모델을 정의해보겠습니다. 예를 들어, 3개의 콘볼루션 레이어와 완전 연결 레이어로 이루어진 간단한 모델을 구축해보도록 하겠습니다:

class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        self.fc = nn.Linear(64 * 4 * 4, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.relu(self.conv2(x))
        x = F.relu(self.conv3(x))
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

이 모델은 3개의 콘볼루션 레이어를 거쳐 최종적으로 완전 연결 레이어를 통해 출력을 생성합니다.

2. CNN 모델의 깊이 조정하기

CNN 모델의 깊이를 조정하기 위해서는 콘볼루션 레이어를 추가하거나 제거하면 됩니다. 예를 들어, 콘볼루션 레이어를 하나 더 추가하여 모델을 더 깊게 만들 수 있습니다:

class DeeperCNN(nn.Module):
    def __init__(self):
        super(DeeperCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        self.conv4 = nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1)
        self.fc = nn.Linear(128 * 4 * 4, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.relu(self.conv2(x))
        x = F.relu(self.conv3(x))
        x = F.relu(self.conv4(x))
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

위의 예시에서는 conv4라는 추가적인 콘볼루션 레이어를 추가하여 모델을 깊게 만들었습니다.

반대로, CNN 모델을 더 얕게 만들기 위해 콘볼루션 레이어를 제거할 수도 있습니다. 예를 들어, SimpleCNN 모델에서 마지막 콘볼루션 레이어인 conv3를 제거하여 모델을 더 얕게 만들 수 있습니다.

3. CNN 모델 학습 및 평가하기

CNN 모델을 학습하고 평가하기 위해서는 데이터셋을 로드하고 학습과정을 설정해야 합니다. 이 부분은 데이터셋과 학습 과정에 따라 달라질 수 있으므로 자세한 내용은 FastAI 문서를 참조하시기 바랍니다.

아래는 FastAI를 사용하여 CIFAR-10 데이터셋으로 CNN 모델을 학습하고 평가하는 예시입니다:

# 데이터셋 로드
path = untar_data(URLs.CIFAR)

# 데이터 블록 구성
dblock = DataBlock(blocks=(ImageBlock, CategoryBlock),
                   get_items=get_image_files,
                   splitter=GrandparentSplitter(train_name='train', valid_name='test'),
                   get_y=parent_label)

dls = dblock.dataloaders(path, bs=64)

# 모델 생성
model = DeeperCNN()

# 학습 설정
learn = Learner(dls, model, loss_func=CrossEntropyLossFlat(), metrics=accuracy)

# 학습
learn.fit_one_cycle(10)

# 평가
learn.validate()

위의 코드는 CIFAR-10 데이터셋을 사용하여 DeeperCNN 모델을 학습하고 평가하는 과정을 보여줍니다.

결론

FastAI를 사용하여 CNN 모델의 깊이를 조정하는 방법에 대해 알아보았습니다. CNN 모델의 깊이를 조정하여 성능을 향상시킬 수 있으며, 이는 이미지 인식 및 컴퓨터 비전 작업에서 매우 중요한 요소입니다. FastAI는 이러한 작업을 보다 쉽게 수행할 수 있도록 도와줍니다. 추가적인 성능 향상을 위해 다양한 모델 구조를 시도해보고 데이터셋에 적합한 깊이와 구조를 찾아보세요!