[python] PyMySQL을 이용하여 데이터베이스의 데이터를 통계 및 집계하는 방법을 알아본다.

이번 포스트에서는 Python과 PyMySQL 라이브러리를 사용하여 데이터베이스의 데이터를 통계 및 집계하는 방법을 알아보겠습니다.

PyMySQL이란?

PyMySQL은 Python에서 MySQL 데이터베이스에 접속하고 작업하는 데 사용되는 라이브러리입니다. 이 라이브러리를 사용하면 Python 코드에서 SQL 쿼리를 실행하고 결과를 다룰 수 있습니다.

PyMySQL 설치하기

먼저, PyMySQL을 설치해야 합니다. 다음 명령을 사용하여 PyMySQL을 설치할 수 있습니다:

pip install PyMySQL

데이터베이스 접속하기

데이터베이스에 접속하기 위해서는 다음과 같은 정보가 필요합니다:

이를 바탕으로 다음과 같이 데이터베이스에 접속할 수 있습니다:

import pymysql

host = 'localhost'
port = 3306
user = 'root'
password = 'mypassword'
database = 'mydatabase'

# 데이터베이스에 접속
conn = pymysql.connect(
    host=host,
    port=port,
    user=user,
    password=password,
    database=database
)

# 커서 생성
cursor = conn.cursor()

데이터 통계 및 집계하기

PyMySQL을 사용하여 데이터베이스의 데이터를 통계 및 집계하려면 SQL 쿼리를 실행해야 합니다. 다음은 몇 가지 예제를 보여줍니다.

행 개수 세기

# 전체 행 개수 세기
query = "SELECT COUNT(*) FROM mytable"
cursor.execute(query)
row_count = cursor.fetchone()[0]

print(f"행 개수: {row_count}")

열 합계 구하기

# 열 합계 구하기
query = "SELECT SUM(column_name) FROM mytable"
cursor.execute(query)
column_sum = cursor.fetchone()[0]

print(f"합계: {column_sum}")

그룹화된 데이터 집계하기

# 그룹화된 데이터 집계
query = "SELECT column_name, COUNT(*) FROM mytable GROUP BY column_name"
cursor.execute(query)
results = cursor.fetchall()

for row in results:
    column_value = row[0]
    count = row[1]
    print(f"{column_value}: {count}")

데이터베이스 연결 종료하기

데이터베이스 작업이 끝나면 연결을 종료해야 합니다. 다음과 같이 close() 메소드를 사용하여 연결을 닫을 수 있습니다:

# 데이터베이스 연결 종료
cursor.close()
conn.close()

요약

이번 포스트에서는 PyMySQL을 사용하여 데이터베이스의 데이터를 통계 및 집계하는 방법을 알아보았습니다. 데이터베이스에 접속하고 SQL 쿼리를 실행하여 원하는 통계 및 집계를 수행할 수 있습니다. PyMySQL의 다양한 기능을 활용하여 데이터 분석 작업을 수행해 보세요.

참고 자료