[python] 파이썬에서 데이터베이스에서 데이터 집계하기

파이썬을 사용하여 데이터베이스에서 데이터를 검색하고 집계하는 것은 중요한 작업입니다. 이런 작업을 수행하려면 보조 라이브러리를 사용하여 데이터베이스에 연결하고 SQL 쿼리를 실행해야 합니다. 이를 통해 특정 조건을 만족하는 데이터를 검색하고, 그에 따른 통계나 집계값을 얻을 수 있습니다.

데이터베이스 연결

가장 먼저 필요한 것은 데이터베이스에 연결하는 것입니다. 이를 위해 psycopg2 라이브러리를 사용하여 PostgreSQL 데이터베이스에 연결하는 것을 예로 들어 보겠습니다. 다음은 데이터베이스에 연결하고 커서를 설정하는 코드입니다.

import psycopg2

# 데이터베이스에 연결
conn = psycopg2.connect(
    dbname="mydatabase",
    user="myuser",
    password="mypassword",
    host="localhost"
)

# 커서 생성
cur = conn.cursor()

데이터 검색 및 집계

이제 연결된 데이터베이스에서 데이터를 검색하고 집계할 수 있습니다. 아래 예시에서는 sales 테이블에서 특정 기간 동안의 매출 데이터를 검색하고 합계를 구하는 방법을 보여줍니다.

# 데이터베이스 쿼리 실행
cur.execute("SELECT SUM(amount) FROM sales WHERE date >= %s AND date <= %s", (start_date, end_date))

# 결과 가져오기
total_sales = cur.fetchone()[0]

위 코드에서 start_dateend_date는 적절한 값으로 대체되어야 합니다.

데이터베이스 연결 종료

작업이 끝나면 데이터베이스 연결을 정리해야 합니다.

# 커서 닫기
cur.close()

# 연결 닫기
conn.close()

결론

파이썬을 사용하여 데이터베이스에서 데이터를 검색하고 집계하는 방법을 살펴보았습니다. 이는 실제로 많은 데이터 분석 및 보고 시나리오에서 활용될 수 있습니다. 데이터베이스 연결, 쿼리 실행, 결과 처리 및 연결 종료 각각에 유의하여 작업을 수행해야 합니다.