[파이썬] ORM을 사용한 데이터베이스 캐싱 전략

01 Sep 2023

python

데이터베이스 쿼리 성능을 향상시키기 위해 캐싱 전략을 사용하는 것은 매우 효과적입니다. 캐싱은 데이터를 메모리에 저장하여 다음에 동일한 쿼리가 실행될 경우 데이터베이스에 접근하지 않고 캐시된 데이터를 반환함으로써 응답 시간을 줄일 수 있습니다. ORM(Object Relational Mapping)을 사용하면 데이터베이스 쿼리를 보다 쉽게 관리할 수 있으며, 캐싱 전략을 구현하는 데에도 유용합니다. 이번 글에서는 파이썬에서 ORM을 사용하여 데이터베이스 캐싱 전략을 구현하는 방법에 대해 알아보겠습니다.

ORM 소개

ORM은 객체와 관계형 데이터베이스 간의 매핑을 자동화해주는 도구입니다. 개발자가 데이터베이스에 직접 SQL 쿼리를 사용하지 않고 객체와 같은 형태로 데이터를 다룰 수 있도록 도와줍니다. 파이썬에서 가장 널리 사용되는 ORM은 SQLAlchemy입니다. SQLAlchemy는 다양한 데이터베이스 시스템과 호환되며, ORM 기능뿐만 아니라 캐싱 기능도 제공합니다.

캐싱 전략 구현

SQLAlchemy에서 제공하는 캐싱 기능을 사용하려면, 캐싱할 데이터를 식별하는 유일한 키를 정의해야 합니다. 일반적으로 데이터베이스의 프라이머리 키를 사용하며, 이를 통해 캐시된 데이터를 식별할 수 있습니다. 다음은 SQLAlchemy ORM을 사용하여 데이터베이스 캐시를 구현하는 예제 코드입니다.

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import scoped_session

# 데이터베이스 엔진 생성
engine = create_engine('sqlite:///mydatabase.db')

# 세션 팩토리 생성
Session = sessionmaker(bind=engine)
session = scoped_session(Session)

# 데이터베이스 모델 정의
Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    
    id = Column(Integer, primary_key=True)
    username = Column(String(50), unique=True)
    email = Column(String(50), unique=True)
    password = Column(String(50))
    
    def __repr__(self):
        return f"<User(username='{self.username}', email='{self.email}')>"

# 데이터베이스 쿼리 함수
def get_user_by_username(username):
    # 캐시에서 데이터 조회
    cached_user = session.query(User).filter(User.username == username).first()
    if cached_user:
        return cached_user
    
    # 캐시에 데이터가 없으면 데이터베이스에서 조회
    user = session.query(User).filter(User.username == username).first()
    
    # 조회 결과를 캐시에 저장
    if user:
        session.add(user)
        session.commit()
    
    return user

위의 코드에서는 SQLAlchemy를 사용하여 데이터베이스 연결을 설정하고, 데이터베이스 모델을 정의합니다. get_user_by_username 함수는 username을 매개변수로 받아 해당 유저를 먼저 캐시에서 조회합니다. 캐시에 해당 데이터가 없는 경우에는 데이터베이스에서 조회한 후, 조회 결과를 캐시에 저장합니다. 이렇게 함으로써 데이터베이스에 다시 접근하지 않고 캐시에서 원하는 데이터를 가져올 수 있습니다.

캐시 만료

캐싱은 메모리를 사용하기 때문에 메모리 제한이 있는 환경에서는 주의해야 합니다. 캐시된 데이터는 정기적으로 업데이트되어야 하며, 만료된 데이터는 삭제되어야 합니다. SQLAlchemy는 캐시된 데이터를 주기적으로 삭제하는 옵션을 제공합니다. 다음은 SQLAlchemy에서 캐시 만료를 설정하는 예제 코드입니다.

from sqlalchemy.orm import strategies

# 캐시 만료 시간 설정 (5분)
expiration_time = 300

# 세션 팩토리 생성
Session = sessionmaker(bind=engine, expire_on_commit=False)
session = scoped_session(Session)

# 캐싱 전략 설정
caching_strategy = strategies.ExpirationTime(strategy_options=expiration_time)
session.configure(query_cls=strategies.QueryCache, cache=caching_strategy)

위의 코드에서는 expire_on_commit 옵션을 사용하여 커밋 후에는 캐시된 데이터가 만료되지 않도록 설정합니다. 또한, ExpirationTime 전략을 사용하여 캐시 만료 시간을 5분으로 설정합니다. 이렇게 하면 5분 이후에는 데이터베이스에 다시 접근하여 새로운 데이터를 가져와야 합니다.

결론

ORM을 사용한 데이터베이스 캐싱 전략은 데이터베이스 성능을 향상시키는 데에 매우 유용한 방법입니다. SQLAlchemy를 통해 데이터베이스 쿼리를 보다 쉽게 관리할 수 있으며, 캐싱 기능을 함께 사용하여 응답 시간을 줄일 수 있습니다. 캐싱 전략은 캐시된 데이터의 유효성을 유지하기 위해 적절한 만료 시간을 설정하는 것이 중요합니다. 위의 예제 코드를 참고하여 데이터베이스 캐시를 구현해보세요.